头条今日_全国热点资讯网(头条才是今日你关心的)

今日热点头条资讯
头条才是今日你关心的
首页 > 更多... > 日常前线

千亿独角兽 Databricks 新赛道的中国答卷:拓数派 DataCS 引领 “可信数据 + AI 模型” 新范式

8 月 20 日,全球知名数据与AI公司 Databricks 正式对外发布公告,宣布公司正推进一轮规模超 10 亿美元的 K 轮融资,目前相关各方已签署投资条款清单。此次融资对应的公司估值将突破 1000 亿美元(约合人民币 7179.1 亿元)。在全球未上市的初创企业中,公认估值超千亿美元的玩家包括 SpaceX、OpenAI 以及字节跳动;此外,马斯克旗下的人工智能公司在年初与社交媒体平台 X 完成重组后,其合并融资对应的估值也已突破千亿。而 Databricks 此次融资的完成,将使其成功跻身千亿美元独角兽阵营,成为全球第五家估值超千亿的独角兽企业。

Databricks 及其开源大模型观点

Databricks 成立于 2013 年,始终聚焦于打造数据与人工智能深度融合的统一平台,是 “湖仓一体” 数据库架构的开创者,而这一架构正是 Data+AI 战略落地的关键技术支撑。其数据智能平台构建于开放的湖仓架构之上,为数据及治理工作提供了统一的技术底座,并结合针对企业的独特特性优化的人工智能模型,形成了强大的技术合力。

Databricks产品包括三大模块,全方位满足企业在数据处理、AI应用开发及数据管理等多方面复杂需求:

·数据湖仓:涵盖 Delta Lake 等核心组件,实现高效的数据存储与管理,支持大规模数据的实时处理与分析,为企业的数据流转提供坚实基础;

·AI工具:旗下 MLflow 专注于机器学习生命周期管理,从模型的开发、部署到跟踪,为企业提供便捷高效的全流程支持,助力企业轻松推进AI模型的落地应用;

·数据工具:包含了如 Unity Catalog 等产品,具备强大的数据治理和元数据服务,全方位确保数据的安全性、合规性,同时促进数据的高效发现与使用 ,让数据发挥最大价值。

Databricks 洞察到开源大模型正走向商品化的趋势。而其自身强大的 AI 功能,为这一趋势注入了强大动力。在模型训练加速方面,Databricks 的分布式计算架构能够充分利用大规模集群资源,显著缩短开源大模型的训练周期。在模型部署与管理上,Databricks 提供的一站式解决方案,能帮助企业轻松将开源大模型部署到不同的生产环境中,无论是云端还是本地服务器,都能确保模型稳定运行。同时,通过其直观的界面,企业可以实时监控模型的性能指标,如响应时间、准确率等。一旦发现模型在实际应用中出现偏差,可立即在 Databricks 平台上进行优化调整,保证模型在各种业务场景下持续高效运行,增强了开源大模型作为商品的可靠性与稳定性。

Databricks 以数据为基石,以人工智能为引擎,实现了从ETL到数据仓库再到 AI 的全数据链路。由数据智能引擎(Data Intelligence Engine)帮助企业高效整合和处理大规模数据,将海量数据转化为 AI 模型可直接利用的优质 “燃料”,广泛应用于数据工程与 AI 模型训练的协同、数据科学与机器学习的融合、AI 应用的快速落地等场景。目前,超过 60% 的财富 500 强企业都在借助 Databricks 的数据与 AI 融合平台,让数据更好地驱动 AI 创新,同时通过 AI 反哺数据价值的深度挖掘。

“可信数据+AI模型”赛道的中国开拓者:拓数派DataCS

拓数派作为浙江省准独角兽、未来独角兽企业,凭借“数据+模型”基础AI的核心技术优势与阿里云、DeepSeek等头部企业共同入选“杭州基础AI十八罗汉”。作为来自中国全自主可控的准独角兽,拓数派可信数据+AI模型赛道的另外一个开拓者在数据计算相关领域与Databricks技术视野商业价值很多不谋而合行业趋势共识

在产品体系上,拓数派旗下大模型数据计算系统πDataCS(简称DataCS)创新性构建了平行的可信数据空间与计算空间,向上提供垂类模型全生命周期和智能体开发的工具链体系,向下实现对异构数据和算力的智能化调度,有效破解数据孤岛和算力烟囱难题,助力企业加速数据与模型的融合,为私域大模型和智能体AI的落地提供强大支撑。

四大计算引擎提供连续动力

从数据底座架构来看,DataCS与Databricks高度相似。类似Databricks的数据智能引擎,DataCS由四大计算引擎提供连续动力分别是支持传统BI分析虚拟数仓引擎、专为模型语料库优化向量计算引擎、模型结合私域数据连续训练引擎,以及模型异构算力下的推理引擎,为BI/大数据分析、私域垂类模型的连续训练、垂类智能体的开发和打造等应用场景提供支撑。其中, DataCS 虚拟数仓引擎 PieCloudDB 可无缝对接三方数据和数据分析引擎,以满足湖仓一体、数据湖等场景需求,并原生支持数据要素流转,满足私域客户对数据隐私和控制权的高要求。而 Databricks 则以其 Databricks Lakehouse Platform 为核心,也融合数据仓库与数据湖优势,提供数据处理、分析和机器学习服务,涵盖了数据全链路开发。

主动元数据无缝访问可信数据空间

DataCS独创的简墨主动元数据提供了与DatabricksUnity Catalog类似的统一元数据存储和管理功能该系统可无缝访问可信数据空间,快速整合不同数据系统的多样化数据(如结构化、时序、时空、表格、日志、图像等),统一数据目录以便数据发现。此外,简墨主动元数据还内置数据触发机制,打通私域数据和公域模型的协同链路,让模型主动理解多模态数据价值,持续生成私域专属认知智能,增强智能体的分析和落地,助力企业和政府打造自己专属的智能体工场。

拓数派深耕私域模型和智能体及其对应的数据计算底座,目前客户多为500强核心央国企。

DataCS 已在中国船舶、中国电子和中国航信等国家核心央企承担智能体和垂类模型核心底座。并在多地政府落地异构算力和可信数据管理平台,并成功投产交通、社会治理等智能体。在东吴证券、广发证券等金融机构作为垂类模型智能体开发平台,成功投产了秀才 GPT 和数字人等智能体。

拓数派的全自主可控特性,使其在国内私域数据服务领域筑起坚实壁垒,如同 Databricks 在美国市场凭借技术创新和市场拓展占据重要地位一样。二者虽处于不同的市场环境,但都通过掌握核心技术和服务能力,为各自区域的客户提供定制化、安全可靠的数据解决方案,成为推动私域数据服务发展的重要力量。

 

特别声明:以上文章内容仅代表作者观点,不代表本站观点或立场。如有关于作品内容、版权或其它问题请于作品发表后与我们联系。

分享到:更多 ()
来源:TOM 编辑:WY-BD

评论

留言/评论 共有条点评
昵称:
验证码:
匿名发表