三五环

No.121 对谈志杰:从通义听悟看,当 AI 不再是工具,而是个人助手

Aug. 3, 2023

嘉宾|志杰,阿里云通义听悟产品&研发负责人,前微软亚洲研究院语音团队主管研究员

主播 | 刘飞,产品经理,袋泡原叶茶「三五杯」联合创始人

本期邀请了阿里云通义听悟产品&研发负责人志杰。志杰从本科毕业后一直与语音技术和 AI 技术结缘,在中科大的语音实验室、微软亚洲研究院和阿里云等机构从事相关研究工作。

这是第一次从大厂业内从业者的视角聊了聊做 AI 产品的体会。志杰分享了云上语音 AI 产品在各种场景中的应用,也强调了语音作为人与人之间最基础的交流方式的重要性。我们还探讨了人机语音交互的现状和未来发展方向,以及语音识别、语音转文字和多人语音交流等技术挑战,志杰很坦诚了分享了他的整体态度:理性乐观。

在「通义听悟」查看本期文字稿:

https://tingwu.aliyun.com/doc/share/d6647e9b8bf94e0b8437ebd6a2408c13#/

内容索引

00:35Part1 通义听悟的由来

算法到产品还是产品到算法

应用研究就是解锁场景

人机语音交互到人人语音交流

麦克风与你的距离越来越远,可查的东西却越来越多

技术和产品需要良好的正循环,反之闭门造车、没有壁垒

18:18Part2 AI技术的真正兑现

高技术产生高价值

重点不是卷过你的同行,而是发现价值的蛋糕

现在的大模型可以替代原来N多个小模型做的任务

38:00Part3 通义听悟里程碑及愿景

聚焦,做减法

围绕消费场景里的用户场景和使用场景,来做产品服务

通过模型服务产生价值

交互体系:下面有模型层,模型服务层,上面有大模型to B产品

从工具到助手

47:27Part4 做产品的真正的功力在于创新

实验结果不是靠人的努力来改变的,它是一个自然而然的日常的过程

真正的研究在于创新的速率

人的成见是根深蒂固的,特别在大模型上面

57:12Part5 大模型的应用场景及未来趋势

整个大模型应用的发展阶段,其实还在选题

AI助理是人们对AI的愿景

一定程度上AI更了解你,可能是可以发生的了

01:03:36Part6 技术推动人类社会发展的力量:乐观的前景与挑战

应用层:精度和成本

今天的小模型也是十年前的大模型,今天的大模型也会变成未来的小模型

经济活动本身就是在不断的提高效率的过程,即劳动生产率

技术的发展会给人类带来更大的福祉和新的工作机会

聚焦到价值,其他交给时间

人类的创造力是无中生有,是不可替代的

制作人:严格

片头:Where Are You Going (Live) - 海龟先生

片尾:人间指南 - 岛屿心情

相关

欢迎在评论区留言交流。如果喜欢《三五环》,也恳请能在苹果 Podcast 、网易云音乐、Spotify 或喜马拉雅留下你的宝贵好评。感谢!

商务合作&嘉宾自荐,请加微信: wocaishiliufei

封面图片由 Midjourney 生成,版权所有©️三五环




Podparadise.com neither hosts nor alters podcast files. All content © its respective owners.