从最近的观察来看,越来越多的公司已经开始在自家的产品中接入大模型了。昨晚我们直播,大模型集训班的助教 Carry 老师展示了一个真实应用场景:让大模型帮他筛选简历。具体来说,这事儿有几个关键步骤:
1、怎么把 PDF 中零散的简历信息整理为结构化的数据?比如一份简历中,有姓名、性别、年龄、教育背景、工作经历、意向薪资等信息,人类靠经验很容易识别具体哪个信息是姓名,哪个信息是学历。但怎么让计算机能够把姓名对应到姓名上?
2、从 PDF 转码过来的文本信息,可能还有一些无意义的水印信息,在结构化之前,我们需要把水印信息全部去掉。
(资料图)
3、完成信息的结构化后,我们需要确定规则,告诉系统长什么样的简历可以邀约。比如,相关工作经验必须匹配,学历本科以上,最好之前在大公司待过。
以上这几步,我琢磨了下,如果要是没有大模型技术的话,还挺费事的。比如结构化部分需要涉及信息的提取,水印部分涉及纷繁的正则表达式,规则匹配部分,可能还得用到 Drools 这样的规则引擎……
但现在,有了大模型之后,只需要不超过 50 行的代码,就能搞定。下面是其中的一部分截图。
这周日,墨问西东和徐文浩老师一起出品的大模型集训班就要正式开课了。如果你对大模型技术还是一知半解,那欢迎你加入学习。
我们实实在在地,给你讲讲产品具体应该如何接入大模型,LangChain 是怎么回事,向量是怎么回事,微调是怎么回事,Vicuna、LLaMa 又是怎么回事。
徐文浩老师在这块研究挺深的,5月底时,我们团队还和他连过一次麦,聊了聊最近大模型的新进展,下面是当时的内容总结,看看对你是不是有帮助。
第一,微软最近在 Build 大会上发布了 Windows Copilot,它是一个嵌入 Windows 操作系统中的大模型。之前微软更多的是在 Office、GitHub、Bing 等应用中集成大模型。Windows Copilot 意味着所有人都可以在 Windows 操作系统中使用大模型进行智能对话,并对接各种场景和应用。
过去虽然有像 Siri 这样的和操作系统深度结合的虚拟语音助手,但就效果而言,Siri 和现在的 GPT4 还是有很大的差距。至此,微软从云到应用,再到操作系统,都集成了大模型的能力。可以说,微软这次的动作非常快,也可能是在移动互联网那次浪潮中打脸被打疼了。
第二,Meta 最近推出了几个开源模型,还是值得我们了解下。例如 ImageBind,可以将图像、音频和文本联系在一起;视觉分割基础模型 Segment Anything Model,可以用于图片中元素的处理;最近还推出了一个语音识别和合成模型 MMS,据说比 OpenAI 的 Whisper 效果都好。
第三,Meta 发表的论文《LIMA: Less Is More for Alignment》,他们在原有的 LLaMA-65B 模型上,只是使用了 1000 条精心策划的指令进行微调,就能达到还不错的效果。这进一步证明了我们用大量数据训练出来的基础模型,本身就蕴含了很多很丰富的能力。在此基础上,只需要少量的数据就能够把它的能力进一步激发出来。
第四,还有一个值得关注的是国内的 RWKV 模型,它是一个循环神经网络 RNN 改造的模型,最近在很多数据集的评测中效果很好,为我们提供了一条新的技术路线——在模型架构上,RWKV 创新地将 GPT transformer 改写成 RNN 形式。
第五,一个新名词:Tree of Thoughts,它是 Chain of Thoughts(思维链)的迭代。以往 Chain of Thoughts 的思路是给大模型举一些例子,然后大模型才能更好完成任务。现在 Tree of Thoughts 提出了一种更好地分割大模型任务以提高效果的方法。比如玩 24 点游戏,使用原来的方法,大模型的准确率比较低。但使用 Tree of Thoughts 后,准确率可以达到 70%-80%。
第六,向量数据库,最近很多向量数据库创业公司获得了新融资。做电商也好、做推荐也好,随着数据量的增加,传统的关键词搜索已经不能满足需求,语义匹配的搜索变得越来越受欢迎。尽管这个技术一开始主要是被大公司和使用机器学习的团队使用,但随着大型语言模型的出现,它变得更容易推广给普通的应用开发者。
我们可以看到最近很多公司都在融资,而向量数据库也可能像传统的关系型数据库一样成为一个标准化产品。使用向量数据库并不复杂,无论你是想加入向量数据库的研发团队,还是作为应用开发人员,都应该去了解和使用一下向量数据库。
每个时代都有每个时代的产品。作为创业者,我更多要思考的是怎么跟上时代的浪潮,怎么利用新的技术来提高产品体验。这是工程师和产品经理们的新机会。
如果你正在思考怎么在自己的产品中集成大模型的能力,你正在研究 LLaMa、Vicuna、ChatGLM,以及 OpenAI 的接口,你正在思考到底哪些场景适合用大模型的技术解决,哪些场景适合用传统的机器学习方法解决,那我们的 AI 大模型集训班可以帮到你。
本周日(6月11日)正式开课。直播授课,有共学社群,有助教答疑,有班主任。我们群里的同学也是藏龙卧虎,昨天才发现,香港某大型企业的 CIO 居然也在学。点击下方小程序报名即可。
上一篇:世界通讯!气温“退烧”,局地有暴雨,高考期间天气预报来了
下一篇:最后一页
格隆汇6月7日丨浔兴股份002098002098SZ6月6日召开公司2022年度网上业绩
每经AI快讯,有投资者在投资者互动平台提问:请问贵公司的控股子公司国
同花顺金融研究中心6月7日讯,有投资者向芯瑞达提问,请问贵公司半导体
在6月4日至6日举办的第31届中国国际信息通信展上,中国联通携多项创新
6月7日,银川市兴庆区残疾考生王存(化名)坐着轮椅顺利进入位于1楼的
X 关闭
X 关闭