您现在的位置是 : 首页  >  时尚前沿  > 正文

大模型新势力:IDEA 研究院张家兴入局创业,沈向洋任顾问,首轮估值 20 亿

日期:2023-04-25 14:17:22 来源:量子位

大模型创业江湖,又来了两位重磅大牛。

张家兴,粤港澳大湾区数字经济研究院(IDEA 研究院)讲席科学家、认知计算与自然语言中心负责人,被曝已经启动了创业项目,而他站在他身后,以顾问身份出现的是知名 AI 大牛、IDEA 研究院创始理事长沈向洋

量子位获悉,张家兴新公司据说代号深度空间,大方向是打造大模型底座,希望瞄准 B 端市场打造企业级应用。


(资料图片仅供参考)

以及大牛创业多的是排队想进的投资者。所以即便项目尚未官宣,也只是小圈子里所知,但首轮估值已经高达3 亿美元(折合人民币 20 亿)。

而张家兴,从过往履历和能力来看,确实也值这个价。

去年开源中文版 Stable Diffusion

张家兴,北京大学电子系博士毕业,师从侯士敏;本科阶段在南开大学学习嵌入式系统。主要研究领域为 AI、DL 和分布式系统。

加入 IDEA 研究院之前,先后就职于百度、微软、阿里巴巴,曾任微软亚洲研究院研究员、360 数科首席科学家。

张家兴

在微软亚洲研究院期间,2014 年,深度学习框架研究正处于萌芽期。张家兴在工作Minerva(发表于顶会 NIPS,即后来的 NeurIPS)中,提出用高级语言表述网络结构和用数据流图(dataflow graph)来解耦网络结构和执行引擎。

——这是后来出现的 Tensorflow、Pytorch 等主流深度学习框架的核心设计理念。

同年,他在 NIPS 发表的另一篇论文《Attentional Neural Network: Feature Selection Using Cognitive Feedback》里提出了Attentional Neural Network,以认知概念作为 query 对输入进行选择。

这个概念的提出,比 attention 成为主流早了一年。

《Attentional Neural Network: Feature Selection Using Cognitive Feedback》

公开资料显示,离开 MSRA 后,张家兴先是任职阿里巴巴蚂蚁金服 AI 资深算法专家," 从零到一创建了阿里巴巴和蚂蚁集团的深度学习团队 "。

又以360 数科(原 360 金融)首席科学家的身份," 组建了 360 数科的 AI 数据融合中台部门 "。

2021 年,张家兴加入 IDEA 研究院,角色是认知计算方向负责人,参与过 IDEA 研究院发布的 " 悟道 · 文源 " 等大模型项目。

去年,AIGC 在文生图领域刮起一阵风暴,张家兴带领团队开源了第一个以中文为主的 AI 绘画模型太乙——它被称为中文版的 Stable Diffusion,并在 11 月 1 日推出纯中文版本和中英文双语版本。

据透露,太乙的训练数据量超过了 1 亿中文图文对。

太乙根据提示词 " 小桥流水人家,水彩 " 生成的画作

张家兴曾对外表示,在 IDEA 前作 Taiyi-CLIP-Roberta-large-326M-Chinese、Taiyi-Diffusion-532M-Nature-Chinese 等的基础上,太乙团队从全力投入到完成面世," 用时不足一个月 "。

在 IDEA 同时推进的还有他带领团队创建的" 封神榜 " 大模型开源计划,截至去年年底,共开源了 88 个模型。

今年 2 月底举办的 "2023 全球人工智能开发者先锋大会 " 上,张家兴曾在圆桌讨论上公开表达:

我也是在这一波 ChatGPT 创业的大潮里边,准备入局。

不过一个来月,张家兴已经身体力行地动起来了。

不仅自己躬身入局,还拉了 IDEA 研究院理事长沈向洋一同在大模型之路上探索。

新公司还有谁?

在新公司担任顾问的沈向洋,是 IDEA 研究院的创立者,包括 ACM 和 IEEE 等全球计算机顶级组织的 Fellow,前微软乃至科技巨头里最具权势的华人高管。

他博士毕业于 CMU 计算机学院,是图灵奖得主 Raj Reddy 的学生,主要致力于计算机视觉、图形学、人机交互、统计学习、模式识别和机器人等领域。

后来沈向洋与李开复、张亚勤、洪小文共同参与创建影响深远的 MSRA。

此外,他还是微软必应、微软小冰等一系列知名产品的领导打造者,并因计算机视觉和图形方面的研究成就享誉世界。

沈向洋

2019 年 11 月,微软对外公告称:全球执行副总裁、AI 及技术研发体系负责人沈向洋博士,将于 2020 年 2 月正式从微软退休。

于是 2020 年开始,沈向洋挥别了任职 23 年之久的微软。

但他并未远离 AI 江湖,沈向洋先后出任了小冰公司、Newsbreak 的董事长,其后又亲自参与创办了 base 粤港澳大湾区的 IDEA 研究院成立,担任创始理事长。

在沈向洋的带领下,IDEA 迅速集结起大批人才,其门生故吏云集,迅速打响了影响力。不仅没落下去年爆火的 AI 绘画,打造并开源太乙模型,今年的 AIGC 浪潮也没有落伍。

而且就在最近—— IDEA 还发布了 zero-shot 的视觉应用Grounded-SAM,把目标检测、分割、生成几大视觉 AI 功能 all in one。

发布至今不足半个月,已经在 GitHub 上狂揽 7.2k 星。

张家兴谈大模型

不过目前,还不知道张家兴为何 " 出走 " 创业,或者新项目和 IDEA 研究院之间是否存在关联。

张家兴原本就是沈向洋在 MSRA 治下的老兵,但后来加盟蚂蚁集团,后来又辗转 360 担任首席科学家。

2021 年 6 月,张家兴正式加入 IDEA 研究院担任认知计算方向讲席科学家 。做为认知计算方向的负责人,带领团队,在认知计算和自然语言相关的各个方向进行前沿探索。

他最近一次公开亮相是今年 3 月,在 2023 全球 AI 开发者先锋大会现场,他与几位微软系老朋友,纵论大模型和 ChatGPT 变革后的世界,他认为 ChatGPT 的出现,开启了一个新十年。

并且这个新的十年,就是Generative + General,就是未来是属于生成式 AI 和通用 AI 的。

在这次讨论中,张家兴还留下了名言:

如果我们套用《三体》里面非常著名的一句话," 物理学不存在了 ",那么我们今天从某种意义上也可以说,NLP 技术不存在了

联系作者

标签:

推荐