西风 发自 凹非寺
量子位 | 公众号 QbitAI
阿里通义千问大模型技术骨干周畅,被曝将离职创业!
有知情人称,周畅虽现在还在阿里云系统中,尚未正式离职,但已确定离职意向。
下一步,据36Kr率先报道:周畅或剑指AI应用创业,具体方向还未可知。
作为阿里7年资深算法专家,周畅将离职这一消息引起圈内广泛关注。
消息称通义大模型的研发和开源工作仍正常继续,通义实验室负责人为阿里云CTO周靖人。
最近不少大厂AI骨干被曝单飞,也有不少创业项目都逐渐浮出水面,AI引起的创业浪潮也还在继续。
通义大模型发展的亲历者和见证者
周畅,花名钟煌,阿里通义千问大模型技术骨干之一,曾和团队推出一系列语言模型、多模态模型。
团队研究成果也曾拿下中国电子学会科技进步一等奖等诸多荣誉。
2012年,周畅毕业于复旦计算机科学与技术系,之后进入北大,2017年拿下北大计算机软件与理论博士学位。
主要研究方向包括图表征学习与推理、推荐系统、分布式图计算等。
资料显示,2017年7月,周畅加入阿里巴巴,曾任达摩院智能计算实验室高级算法专家。
在阿里期间,周畅学术成果颇丰,一箩筐论文被各大顶会收录,谷歌学术被引8000+:
2017年至今7年间,周畅可谓见证并参与了阿里大模型的关键演变。
作为国内大模型代表,阿里最初曾先后推出structBERT、M6等系列大模型,直至如今,通义千问模型家族逐渐壮大。今年5月,通义千问模型已进化到了通义千问2.5。
最近难倒一众大模型、火爆冲微博热搜的“9.11和9.9哪个大”问题,在量子位的测试中,也没能难倒通义千问2.5。
量子位相关文章底下评论区也有不少网友表示通义千问可以成功做对:
阿里的开源模型系列也在持续更新。
去年8月,通义宣布加入开源行列,而后陆续推出十多款模型,参数规模横跨5亿到1100亿。
还开源了视觉理解模型Qwen-VL、音频理解模型Qwen-Audio、代码模型CodeQwen1.5-7B、混合专家模型Qwen1.5-MoE。
目前通义开源模型系列下载量已经超700万。
今年6月,阿里通义千问开源大模型进化到了Qwen2,性能全面超越开源标杆Llama 3,发布两小时,冲上HggingFace开源大模型榜单第一。
知情人称,周畅离职,通义大模型的研发和开源工作仍会正常继续,通义实验室负责人为周靖人。
AI大牛创业公司接连涌现
除周畅外,近期还有不少大厂核心骨干被曝离职,不少大佬的创业项目也陆续公开。
这两天,前百度研究院副院长、百度认知计算实验室主任李平被曝离职,创立专注于AI基础设施的公司,名为vecml,并任CEO。
“AI教母”李飞飞首次创业成立的World Labs也有新消息,已突破10亿美元估值,不到4个月成为新晋独角兽。
△李飞飞实验室在空间智能领域的最新进展
再往前,前蚂蚁集团副总裁漆远创业方向被揭秘,产学研并行创立大模型公司无限光年,被曝剑指“可信大模型”。
李沐,辞去亚马逊首席科学家一职,共同创建Boson.ai,目前已经推出了首个大模型成果。
谷歌、Deepmind等也有一众工程师离职,围绕大模型多个方向创业。
OpenAI创始成员、前特斯拉AI主管Andrej Karpathy(卡帕西)近期也官宣创业了,投身一家AI原生的新型学校Eureka Labs。
大佬们纷纷入局,给未来大模型格局又增添了许多新的变数。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.