你真的很难相信,马斯克的第一款恋爱大模型 grog 来了,号称将比 gpt 四更强大。昨天,马斯克宣布 grog 问世,已经开放注册测试不到一小时,马上就把服务器干崩溃了,可想而知火热程度有多大。 grog 如同直接从银河系漫游指南中越出的人工智能, 几乎可以回答任何你提出的问题,而且更能以幽默且贴近现实的方式回应问题,从而在信息过载的世界中提供了一种新的互动形式。除此之外,还有一项功能几乎可以吊打目前市面上所有竞品,就是 blog, 可以运用 x 平台,也就是前推特 的实时高数量数据来回答你的问题。 croc 的目标是在两个月的训练中成为最优秀的产品。而且马斯克在 x 平台表示,这项技术将会融入到目前 特斯拉车辆上。想象一下,驾驶着特斯拉出行,在旅途中与 guar 进行对话,他能够理解你的情绪波动,提供音乐、新闻,甚至是旅行建议,完全基于你当前的心情和需要。 特斯拉的车机系统借助 grog, 将不再是简单的命令执行者,而是成为一个全方位的生活伙伴。马斯克一直以来都是将科幻梦想变为现实的先驱,而 grog 的推出无疑是加快将目前高度再次推向了另一个新的高度。
粉丝1.6万获赞69.2万
今天早上起来一看啊,好家伙,中国的这个模型评测榜单,把国外的 gps 都给差点排倒数第一去了,现在这局面给我有一种怎么说呢,这义和团抵抗八国联军这感觉啊。 咱也不是崇洋媚外,也不是说咱贬低国内厂商,只是说作为一个在业务里面天天使用这些模型的团队来说吧,只能说这个榜单跟我们实际使用体验不太相符。 目前国外吉利斯的效果在多个商业场景对比下来哈,确实还是比其他模型要好。肯定呢,也是发自内心希望自己国产模型遥遥领先,对吧?但咱也得实事求是,不能连自己都骗,对吧? 啊,我是一直觉得啊,差距不可怕,有差距呢才有追赶的方向,认识到差距才能帮我们更好的超越和成长。 但是现在这种情况呢,就好像你数学考试考了个六十分,结果呢,你说你卷子上的字写的特别漂亮,于是你给自己封了一百分, 那你说你这样还还怎么提高呢,对吧?当然,话说回来啊,这个评测其实也一直是 ai 行业一个难题啊, 以前单一任务算法还比较好做,本来就是干一件事,对吧?做的好还是不好呢?一两个指标就搞定了,现在像 gbt 这种大模型出来以后就不太好整了,他的这种涌现效果出来以后,能干各种各样的事情。注意啊,这里不是说他能干十个或二十个事情,而是你根本都数不清他能干多少事情, 这才是最麻烦的。如果能数清楚,哪怕五十个事情,我们也能像高考阅卷平分一样,对吧?把五十个方向测一下得分,然后汇总一个总分,但是他现在什么事都能干,你怎么给他打分呢?给他打个六十分是啥意思呢? 对吧?那这种评测的难题,也使得现在江湖上出现了各路的评测门派,这些门派说到底都在争夺越剑老师这么一个角色,那为什么大家都抢着当越剑老师啊?除了神圣的使命感以外啊,毕竟每个场上都想当第一,对吧?那选谁当第一,这里面就有很多 空间了啊。总之呢,现在整体上也比较混乱,大家看到这种榜单呢,也不用太当真啊,感受一下意思就得了。 另外呢,我对评测的一个建议是啊,不要做这种打总分的模式,就针对某一个行业列出几个大模型常见的应用场景, 对这些应用场景的效果进行打分,这才是对开发者和使用者都有指导意义的评测方式。这种方式呢,也才能够允许咱国内各大厂商的大模型百花齐放,各自打出彼此的差异性,你觉得呢?关注大壮,带你轻松学习 ai!
哈喽,大家好,这里是小楼,天宇读书,我是小楼。最近 ai 大模型的圈子非常的热闹,众位大佬都纷纷推出了自己的 ai 大模型, 我们从推出的时间、应用的规模、是否商用、市场反馈等各个方面做出一个大排行, fyi 仅供参考。第三名 排名第三的是马斯克的首个人工智能模型 rock, 它的中文意思是心意相通神交,这个作为大模型的名字还是挺贴切的。 马斯克是真爱。银河系漫游指南是模仿书里面的一个人工智能 girl 的语言十分幽默,有时候还会带点 讽刺。性能部分呢,超越了 chat g b t 三点五,虽然还比不上 chat g b t 四,但是考虑到开发时间只有几个月, 效率还是非常可观的。它的优势呢,它可以实时从 x 就是以前的推特推文中获得最新的知识, 因为嫁接了 x, 就可以利用原来 twitter 巨量的数据构成了 grerk 最大的护城河。如果你有 x 账号 蓝购认证过,那么就可以在这个 x ai 官网登录排队。第二种方法就是订阅十六美元一个月的 x premium 加服务,内测结束以后就会开放使用。 groc 刚发布就荣登第三,马斯克的格局 和平台令人不能小觑,竞争之路漫漫,我们且看未来的榜单变化。第二名,谷歌巴巴尔的巴尔的的名字来源于十九世纪的诗人、音乐家 john bard。 巴尔的工作时间比 chat g b t 晚了四个月,在经历过体验了 chat g b t。 的诸多惊喜以后呢,就没有觉得巴尔的有太多的新鲜感了。而且今年二月初,虎哥在展示巴尔的过程中出现了一个事实性的错误, 就是对美国天文望远镜的基础知识介绍有一点错,虽然这个错误相当专业,非天文学专业的人实际上是听不出来的,但是依然拖累了谷歌的骨架,一天 时间,市值蒸发了一千亿美元。今年五月份,谷歌升级了巴尔德,使用了 p a l m two 驱动,从五月份开始,全世界一百八十个国家的人可以开放申请使用。虽然谷歌在巴尔德的推进步伐上有一点为难,因为巴尔德 和谷歌的搜索就像左右手互搏,但是呢,考虑到谷歌强大的海量数据的支持, burd 的未来十分可期,但是需要谷歌选对战略方向第一名。目前的 number one 还是 open ai 亮眼的市场表现,我们不用多说了, chat g b t 的周活用户这个数量已经达到了惊人的一个亿。十一月七号, chat g b t 新功能曝光, open ai 推出了新模型 gbt 四 turbo, 知识库更新到了二零二三年的四月份,整体来说呢,就是更强大了,更长的上下文的长度,更强的控制模型的知识升级, 多模态模型微调定制和更高的速率限制,而且更便宜,比 chat g b t 四便宜了三倍,未来无需重复在不同的模型间切换,还可以私人订制。 g b t 推出了 g b t store, 就像苹果的 apple store 一样, open a i 目前是一骑绝尘,市场上以他们作为风向标和试金石,优势明显, number one 当之无愧。但是呢,科技的 更迭是日新月异的,我们永远不知道下一匹黑马在哪里?再过十日,且看排行榜的变化,欢迎收看!
马斯克对 g t t。 四开炮了,发布了他的大语言模型 group, 根据相关基准测试他的水平在 g t t。 三点五和 g t t。 四之间。而他的语料库则来自推特上的信息,他能实时根据推特的信息来强化对世界的理解。这其实挺可怕的,毕竟推特上充满了假新闻, 他也继承了部分马斯克的叛逆,不会拒绝回答任何敏感的问题,不会像 checkpt 那样有相关社区规范。 操作上,他能同时处理多项任务,可以运行多个并发对话。有意思的是, grog 这个词是火星雨,是模仿银河系漫游指南的人工智能。尽管没有文心一言接地气,但很明显,朋克中年马斯克仍然不忘他遥远的星辰大海。
市面上哪个 ai 大模型的中文能力更强?有人测试了一下, gpt 四,毫无悬念的排在所有大模型的前面,仅次于人类。 接下去是 gbt 三点五 turbo。 排名第三的竟然是刚发布不久的这个科大讯飞的新火。然后呢,大家比较熟悉的应该是复旦的莫斯,前段时间刚刚开园,排测试的第七,文星一言排在第九。 以上排名来自 get up 上刚推出的一个叫做中文通用大模型测评基准测试。在 get up 上的名字呢,叫做 super clue, 专门测试中文大模型的效果情况。这个测试还很新啊,前几天刚刚发布,项目的所有者目前只测试了九个大模型,其他的像是比较知名的 cloud, 还有这个通易千问呢,这些都没有测试。像刚出的这个 cloud 升级版 cloud plus, 我感觉肯定不会输给 gpd 三点五是吧。那另外,根据作者所说呢,当下 可能存在数据不完全的问题呢,比较期待小哥的进一步更新了。那至于测试的一些细节数据呢?比如说基础能力测试里面的对话能力,逻辑推理、闲聊能力,还有像是中文特性里的成语、文学、诗词、古文这些内容呢,都有详细的打分数据比较多,感兴趣的朋友可以自行前往查看。
超越 chin gpt 四点零,人家反手一个 autos 给你管上了免费的三点五,也可以直接使用 gpt 四所有的模态功能,并且融为一体。 今天老张带大家走进最新的 gp 四 autos, 第一,实时联网功能,他可以直接通过互联网搜索找到最前沿的十条信息,解决了最早 gpt 数据停留在二零二二年的问题,做自媒体的必备利器。第二,文道上传功能, 咱们可以直接通过对应的文档上传,然后让他总结上方文档内容,让他以中文方式进行沟通。别急,你以为这样就结束了吗? 咱们还可以根据上方内容调用最新的 ai 绘画道义。三,直接总结内容,画出相关的对应图像。如果绘画出的图片不符合咱们预期的要求,我们可以让他画制一个赛博朋克风格的背图,口味相当的哇塞,而且他还可以根据需求帮你同时 总结内容以及相关的图片绘制。大家可以看到他首先为咱们学习了一周相关的计划,而且增加了趣味性非常强的相关配图,咱们还可以让他根据上方配图编写一个发到社交媒体上的相关文案,直接的省略了咱们大量的文字编写时间, 并且上下纹的结合能力也是非常非常强的,图片修改功能也是非常强大。添加一只猫咪,他可以瞬间的保持这个狗的形象,把 把这张猫呢添加到咱们队的图片中,甚至可以直接编写一些析除指令,根据指令画出对应草图。设计工人们,你们的福音也来了,还不抓紧体验,还在等什么?
马斯克旗下 ai 公司仅用两个月就推出大模型,部分超越 gpt 三点五,未来将开园。近日,马斯克旗下的人工智能公司 xai 推出了首款 ai 产品 grog。 这款 ai 产品能实时抓取社交媒体 x 前推特上的信息,亦给出更具有时效性的答案。 xai 团队表示,他的数学和推理能力类似于 openai 的 gpt 三点五版本, 并表示目前市面上只有 gpt 四这样使用了大量数据和算力训练过的模型才能超过他。据悉, rock 通过了匈牙利的高中数学期末考试,成绩为 c。 对于人工智能的开源问题, 马斯克表达了他的观点。他认为人工智能初创公司 openai 的避员行为并不可取。为此,马斯克旗下的首款人工智能聊天机器人 crock 将采取开源政策。 开源将有助于人工智能技术的快速发展,并让更多的开发者能够参与到这个领域的研究中来。期待看到更多创新的 ai 技术问世。
刚刚 opennight 给所有的 plus 用户都推送了一个长着眼睛可以独图的 ai 大模型 gbt 四 vision, 可能很多人呢还没有体验过,我先替大家呢深入的研究了两周时间,这条视频呢,就通过十五个案例详细给大家捋一捋, t 四 v 呢,到底有哪些惊人的能力,会颠覆哪些行业?越看的后面越离谱啊!大家好,我是创业司机,一个 ai 创业者,专注于分享如何用 ai 提升百倍生产力。首先第一个被颠覆的行业绝对是教育行业, 比如可以上传一张课本里人类细胞的教学图片, ai 可以非常详细的给你讲解每个部分里面都有什么,在细胞里面都起到什么样的作用。或者可以输入一张更有挑战性的更复杂的系统架构图, 让 ai 呢根据这个架构图,一步一步指导你去实现这样的一个系统。我觉得这就是未来的教育模式,无论是小朋友还是大学生,都 可以指着任何不会的问题, ai 都能够一步一步的详细耐心的给出讲解。当然,有了这个技术,现在学生肯定是比老师更加兴奋,原因你懂的哈,这笔题思维还有很强的文字处理能力, 这一点我觉得他已经远远超过了我们普通人类。比如这是一个复杂的停车的标牌,写满了各种各样条件下,什么时候可以停车,什么时候不能停车的各种规则。 任何人在这个标志面前估计都要迷茫一阵子吧。但当我把它输入给 a a, 我问他,我现在在这里能不能停车,他会瞬间的回答你,综合考虑各种规则,现在是可以停车的。 如果这个还太简单的话,来来来,上一个地域模式。医生处方, ai 竟然是可以阅读医生处方的,你觉这离不离谱?并且解读结果被医生认为是非常准确的?对,聪明的你是不是已经想到了, ai 是不是可以去搞定那些又头晕又烦人的验证码? 没错,现在我们人类已经没有办法用验证码的方式把非人类挡在系统外面了。更加令我惊讶的是, j b t 四 v 竟然对序列图片有理解能力。什么意思呢?就是 j b t 四 v 支持输入一系列的图片, 假如这一系列图片是按照时间顺序排序的,那么 g b t 四 v 就有了对视频理解能力。这也太夸张了吧。比如我输入这四张图片,我问这个人在干什么? 回答说,这个人在做俯卧撑,我又输了这个答论顺序的五张图片。我问 a, 如果是按照一个做寿司的正确的顺序,他的排序应该是怎么样的? ai 可以非常精准的把图片重新排序,甚至 ai 还有根据图片内容去预测下一步的能力。 比如说,我输入这连续的三张图片,我问他下一步会发生什么? ai 回答,穿白色球衣的球员可能会射门,而穿黑色球衣的什么原会阻止这场射门?我甚至怀疑啊,绝对 不出一两年,球场上就会出现 ai 裁判了。假如我们逆向思维来利用这个功能,当我说这四张毫无相关图片,我想让 ai 按照顺序给我讲一个故事, ai 竟然给我生成了一个未来世界里 恐龙被基因复活的科幻小说除了读图,这部阶思维还表现出了非常强的图像推理能力。当我给他前三个图形的时候,我问他第四个图形应该是什么?当我给他前八个箭头方向的时候,我问他第九个箭头方向应该是什么?所以 ai 不仅仅会认识图片, 而且还会在图片中去联想类比、找规律。所以各大公司如果你还在用这些题目去筛选你的员工的话, 你为什么不直接雇佣一个 ai 员工呢? j b t。 思维在职场里面可以用到的场景啊,太多了,本身 j b t。 编程就是它的强项,现在甚至你可以输入任何界面,甚至是一个手绘的草图,它都可以生成对应的前端后端代码。比如把这个 萨斯网站截图输入给 j b t, 它生成的代码是可以直接运行的。兄弟们。再比如输入这张 s 光片,它可以直接指出这个片子里面到底哪里有问题,并给出具体的诊疗意见。 j b t。 思维不仅是一个超强的理科生,而且情商也特别高,但是从这些表情里面去理解人类的情绪,这已经是基本的操作, 他甚至还懂得如何去利用视觉语言去调动人的情绪。比如我说说,同样一张图片,我让他用让人感到恐惧 或者让人感到放松的方式分别去描述这张图片,他会根据相同的场景去生成完全不同的描述。大家想一想,在我们的生活里面,是有多少场景是需要用到眼睛,是涉及到图片的,就能够理解这项技术。他到底有多么的惊人,会给我们的生活带来多少颠覆? 几乎所有的行业都会被颠覆,都会被重新定义。我的团队会结合这项新技术去开发更多好玩的,提高百倍效率的事情。关注创业司机,接下来我们会分享这个大模型到底还有哪些问题,还有哪些局限性,以及会带来哪些新的创业机会。
二零二三年六月十三日,三六零公司创始人周红一在三六零产品发布会上表示,中国大模型部分能力已经超过了最近火热的四点零。此言一出,引起了广泛的关注和热议。那么,这种说法是否靠谱? 中国的大模型水平到底如何呢?这里我们先解释一下什么是大模型。所谓大模型,是指拥有巨大餐数量和计算能力的人工智能模型。目前,大模型在自然语言处理、 图像识别、语音识别等领域有广泛应用。而在这些领域中,由 open ai 在二零二三年三月十五日凌晨发布的四,正是一款备受瞩目的大模型。 从公布的情况来看,四已经表现出许多通用人工智能的特征,一些测试结果已经超越了大部分人。那么,中国的大模型水平如何?我们可以从 多个角度来看。首先,客观来说,从学术研究来看,中国的大模型研究水平已经相当高。二零二一年,中国科学院自动化研究所、清华大学等机构的研究人员合作发布了一篇题委 sorry 高效的大规模多模态模型训练方法的论文。 该论文提出了一种高效的大规模多模态模型训练方法,这一方法事实上已经超越了 openai 发布的负三。此外,中国的大模型研究也得到了国家的大力支持。 如二零一九年,国家自然科学基金委员会设立了人工智能前沿联合基金,专门用于支持大模型研究。 其次,从产业发展来看,中国的大模型产业也在快速发展。众所周知,人工智能产业是我们高度重视的领域之一,大模型也是其中的核心技术之一。目前,中国的大模型 产业已经涵盖了算法、芯片、云计算等多个领域,并且在这些领域中,中国的公司已经具备了相当的技术实力和市场份额。最后,从技术实力来看,中国的大模型水平也在不断提升。各大互联网巨头纷纷推出自家的产品,例如 阿里巴巴推出了通易千万,百度公司推出了文心一言,华为推出了盘古系列 ai 大模型,三六零推出了三六零智脑四点零,商汤科技推出了日日新大模型,科大讯飞推出了新火大模型。这里就不一一列 区域。简而言之,中国大模型开发已经呈现百戈争流千帆径的态势,其中一些大模型已经处于世界领先水平。不过需要注意的是,周鸿一所说的中国大模型部分能力已经超过四点零是一个非常宏观的说法,具 题指的是哪些方面,还需要更多的数据和实验来证明。因此,我们万不能盲目自信。在人工智能落地应用爆发的前夕,我们更需要的是持续投入研究和发展,才能在大模型领域取得更大的进展,赶上甚至超越国外同行。 综上所述,无论是从学术研究、产业发展还是技术实力来看,中国的大模型水平都已经达到了相当高的水平。相信在未来的发展中,中国的大模型将继续发挥着重要的作用,为人工智能领域的发展做出更大的贡献。关注我,不迷路,下期更精彩!
目前这个大模型啊,是否是可以替代马龙?能否替代工程师?毕竟普林斯顿大学和芝加哥大学他们就发了发表了一篇文章啊,重点去讲了一下,就如果是一些比较复杂的一些编程问题来讲,目前这个 gpd 四它它的解决的这个能力是非常弱的 啊。呃,是非常弱的,他只有几,呃,他在有个全世界非常著名的一个开源的网站叫 github 上面我经常讲的,呃, 他拿了这个真实事件给叉不上面的一些问题去看 gpd 四能不能去真实的去像工程师,像马龙一样去真实的去解决这些问题,那么他的解决率是百分之零啊,那基本上是不能解决的,他等于是他有各种各样的问题啊。所以呢, 目前这个对,目前因为这个大量的这个裁员呐,因为在美国的话呢,有各种,呃,特别是一些科技公司啊,大量的裁员, 把一些五哥啊啊, facebook 啊,一些大量的一些公司把一些工程师给裁掉了啊,那么这个别人有些人就是认为这个 chat gpt 的这种呃, ai 的这个 copilot 就是帮助辅助工程师的这些工具发明之后啊,就是推,对这个裁员 这些马龙是起到了推波助澜的这样一个作用啊。呃的,所以他们就在这个情况下真实的就是做了这样一个研究啊,他们呢就发,同时他们还发布了一个一个叫 s w e 的这样 ban 序的这样一个评估的这样一个 数据集合评估的一个套件啊,通过这个套件他可以去去评估这些大模型啊,他能是否能够真实的解决世界上的一些工程师的这样的一个问题,而不是理论上课本上的一个什么简单的算法啊,或者一个什么语法,就是比较简单的一些啊?他不是的。 原来的话呢,我们知道 gd 四目前的这个编码的这个能力的话,它的评估它是用 obanai 的,有一个叫 human ever 的这样的一个评估测试的这样的一个套件啊,之前我也是经常讲的啊,目前在所有的这个大模型里面, gd 四的能力是最强的啊, gd 四的能力是最强,目前开源界的这些,像科德拉嘛,包括 法埃的那个阿玛类似的这种大模型,他的解决这种代码的能力也是非常强的啊,但相对来讲,呃,他们都是用 human ever 的这样的一个评测报告的啊。 那么 humani 的评测报告的话,之前我也是介绍过他,相对来讲,他都是一些比较简单的问题,就一共有一百六十四个问题,好像是一些比较标准的一些算法和一些函数啊,他能够去解决啊,那么对一些目前真实的人类工程师要解决的一些问题的一些,目前测下来查, 确实这个大模型的能力还是不够的,有待提高的,他等于是这样啊,好,那么目前呢,还有一个比较热的一个问题呢,是什么呢?之前像有些网站啊,嗯,呃, obai 的一些爬虫啊,他会把那些网站的数据去爬到他们公司内部,然后再进行这个训练。他们的大模型啊,让他们这个 啊,就是让他们的这个模型啊,他的能力就越来越强,但是这些数据呢,他都不是 oppo ai 的,他等于是这样,那么所以的话呢,就是目前也引起了很多的一些就是冲突吧,等于像美国有一家公司啊,像叫 steak overflow 这家公司的话,他专门是帮这种程序员一些问答相互分享的这样的一个网站啊,那目前最近的话呢,他也是裁员了三分之一啊,裁了不少的人啊,因为恰恰这这种应用发布了之后啊,对他们的整个的流量也造成了一些比较大的一些影响 啊,原来他们都会到他这个网网站上去搜索答案的啊,现在的他们就直接在掐着 gp 上去问这个机器人去找答案啊,他等于是这样啊,那这样可以加速这个 开发的效率,或者有些问题的话,他可以让工程师直接跟这些 ai 的机器人直接可以聊天啊,他通过这种方式去解决一些问题啊,或者学习些新的东西啊,他会比较快啊,比原来你在整个网站上去搜索一些帖子再去找问题会更快一点啊。 所以那么现在的这些网站就是非常反感这种 oba ai 的这种做法啊,他不像原来 google 的一些搜索引擎啊,虽然他们把呃爬虫把这些数据扒到搜索引擎里面之后啊,他们也会呃通过搜索引擎再通过这个流量啊,在 引导到原来的网站上去啊。但是现在这种 ai 的这种应用的话,基本上就直接把这个问题和答案告诉他了,他不会告告 他他原来用了哪个帖啊,是通过哪个网站学习到的,他就不会跟他讲啊,他有这样的一些问题啊,所以这里也是比较大啊,那么普林斯顿大学和芝加哥大学他们的这篇论文,最新的论文的话呢,就也说明了目前大模型想取代马龙等的还早啊, 说明 ai 目前的这个能力还不行,还不太行啊,但我觉得他们这篇论文也有价值啊,他能够找出目前大模型不行的地方啊,同时也能够提出了一个全新的框架啊,那么让所有的这些做大模型的一些人啊,可以往这个方面再去努力啊,去看看能不能去 不断的去提升这方面的能力,让他越来越强啊。这个是我觉得是这样的好,虽然目前来讲他的这个目前这些大模型还不能完全替代这些工程师啊,但是你不可否认他的这个能力还是他还是可以提高现有的这些工程师的开发的这个效率,他还是能, 这个是毋庸置疑的他的。嗯,好,这个主要是目前他们这个两个差异啊,你可以认为评估标准的是一个真实世界的一个复杂的这样一个软件问题。 那么 human ever 的 open ai 提供的这样一个评估级呢,就是相对来讲他都是教科书理论上的,或者是说一些传统的一些算法的一些问题啊,这个是有标准答案的,那么这种的相对来讲就他这个没有太大的标准答案啊,他需要根据实际的情况要去解决的好, 那么目前呢,他们也提供了这样的一些,呃,整个一个套件也提提提供了这样一些数据集,数据集我看到他们甚至还训练了这样的一个模型,他们自己训练的模型的话,目前的这个能力也是比较差的, 他是在扣德拉玛上面训练的,这个是他造件整个评估整个一个套件的,一个一个一个结果,他是不是成功啊?他一个结果相对来讲是比较难的,我看了一下是比较难,他要随机的去拿到这 样的一个代码仓库里面的某一个项目啊,能找到某一个问题,通过这个大模型去解决,解决这个问题通应用到这个原来的主干上面,通过这个单元测试啊,通过他的整个一个集成测试,这个还是比较难的好。 他们也微调了这样的一个模型,叫 sw e 杠拉码,他是在现有的 coda 码上面进行微调的其实一个模型,但是我看他的目前的这个能力也不是很强,他微调完应该比 g p d 四稍微好一点,我看了一下有一个模型,那就这个零点七,零点七解决能力比 g p d 四好一点, 比 gp 三点五也好一点啊。所以如果我们要真的要去做一些,可能还是要根据根据一些行业模型进行微调的,要走这样一条路,通用模型的话,目前能力还是不够的,能力还是不够的好,我们最后看看他,他结论的话呢,就是黑字上面结的目前的这个大模型 啊,他是无法替代目前的工程序员的啊,这个让我们的那个程序员可以松一口气啊,但是呢,他是可以加快整个一个工作流程的啊,这个是毋庸置疑的啊。所以呢,我们这些工程师的话呢,还是要拥抱 ai, 还是要拥抱先进的工具啊,能够更好的去产出这些代码,他等于是这样,好吧?好,今天文章我就跟大家就交流到这。
国产 ai 真的崛起了,兄弟们,这个国内自主研发的数学模型在数学测试上已经完全的碾压了 gps 切的 gpd 这些通用语言模型更像是一个文科生,在语言翻译、理解和生成上有着出色的表现,但是一碰到数学题他就有点答非所问了。但是好未来在数学的数据和业务上,将近二十年的积累,让这款千亿级数学大模型更有优势。 目前马齿 tpt 的数学计算能力已经覆盖了小学、初中、高中的数学题,题目类型涵盖了计算题、应用题、代数题 多个类型。马齿 gpt 可以用内置的公式和文字进行数学题提问,而且还可以针对题目进行追问,还支持上传图片进行提问。这个有点类似于之前的拍照 pp, 但是和之前直接给你答案的 app 还不太一样,他更像是一个尽职尽责的数学老师,还给你提供了详细的解题原理和思路逻辑。 唯一遗憾的是,他目前只支持数学类的题外,希望 ai 的发展一定能在教育领域的各个学科普及,给老师和学生们提供更多的帮助。
这次 gpts 的升级可以说是 ai 应用开发者的一场狂欢,接下来的时间里,会有大量有意思的 ai 应用出现在 openai 第一届开发者大会上。 g p t 四特工上下文长度增至十二万八千 focus 让开发者可以构建处理更长对话的应用,这对于维护复杂对话和内容至关重要,比如法律、财报相关方面的整合工作。同时,模型的延迟时间降了一倍,更好地支持向在线客服这种需要及时响应的实时应用。 并且在 g t t 四团购中,每个 token 输入的价格降为零点零一刀,输出的价格降为零点零三刀,综合经济效益比原先便宜了近三倍,使得开发者在进行大规模部署时成本更低。在此基础上, g t t 四全面开放多模态能力,开发者可以在运用中 整合文本阅读、图像识别、语音交互等功能,创造更加丰富和互动的用户体验。比如 通过结合视觉和语言理解,开发帮助盲人看世界的 b i s。 同时, g p t 四 cobro 还支持 g s o n 模式,允许开发者以结构化的方式发送请求和接收响应,简化了开发流,减少了数据处理中的障碍, 让开发者能够更加专注于创造性的编程和产品创新。比如写几个要求就能得到一个贴心的旅游助手。 而这次升级的重头戏就是支持定制化工具,开发者可以根据客户的具体要求调整 ai 的表现,使其更适合特定的应用,比如为特定行业量身定制的聊天机器人,或者为某个特定任务优化的语言模型,增加 ai 技术的适用性和精确度, 同时 open ai 的研究人员也会共同参与进来。官方还推出了版权盾,保护开发者和内容创作者的版权,降低处理潜在版权问题的时间和资源投入。 open ai 官方还披露出,目前使用 gdp 四 api 进行应用开发的开发者人数超过两百万, chatet 的周活跃用户超过一亿。 因此他们推出了类似苹果 app store 的 ai 应用商店,不管你是微调 gtt 四还是定制化工具,都可以直接上架商店出售应用,应用卖的越好,你能获得的提成比例越高。总的来说,本次升级让 gtt 四支持多模态的同时 降低使用 ai 开发应用的门槛,同时 top 价格下降,大幅降低了应用开发成本。或许属于大模型的 iphone 时刻已然来临。
在经营山举行的 openni 开发者大会上, openni 的创始人和 ceo 奥特曼发布了 gpt 次 tuber, 这个史上最强的聊天机器人又进化了,他又出了什么掉炸天的新功能呢?我是 steph 极拳庞博士, 下面我就在大会现场给大家带来第一首的解读。这次欧派推出了 g p t 四点零的 tuber, 也就是 g p t 四点五, 这个大模型比以前更加的聪明。对使用者来讲他有四大亮点,第一就是他的 contex window 增加到了惊人的一百二十八 k, 这个就相当于是聊天机器人的短期记忆,一百二十八 k 的 token 就相当于是三百页的书, 这个非常重要,尤其是你想让他读文献或者是写小说,相当于三百页之内的他都记得非常的清楚,你让他帮助理解或者是扩展小说的内容,他都没问题了。 第二是他脑子里的知识更加实时了,以前他训练的知识是截止到二零二一年九月份,现在这个已经更新到了今年的四月份,而且今后还会不断的在往前更新。第三就是你使用的时候不再需要去选是三点五还是四或者是其他的 plucky, 他会根据你的问题自动帮你选择。 第四也就是最有划时代意义的就是他推出了 gpt 的应用商店,在这里你就可以找到各种各样的基于 gpt 的人工智能助手。这四点还不是最重要的,最掉渣天的是让我们所有人都可以成为他的开发者,让你零基础和零代码,只要会说话就可以做出这些人工智能助理, oppo i 还会跟你分享佣金。对于像我们这样的开发者来讲,还有两个更大的好消息,一个是它所有 a p i 的价格基本上是降了两到三倍,另外就是它 他的编程变得非常简单了,上过我的拆的 gpt 和大模型应用开发课的同学都知道,你需要使用第三放的工具,像蓝衬还有适量数据库,这样才能给 gpt 涨上短期和长期记忆,并让他学会你产品的知识。 现在 open a 把这些功能都集成到他自己的里边了,推出了新的 system 的 api, 原理还是一样,但开发起来更加的简单,让我们每个人都可以成为他的开发者。 这个是不是太酷了?我也会给大家再开一门课,教大家怎么来使用这个新的 system 的 api, 让你不要错过这个巨大的人工智能的应用商店机会, 大家可以私信我报名。奥特曼这次也透露了 chittpt 的用户的增长情况,他的周活已经达到了一亿人次,是人类历史上最大的人工智能的应用。所以就像我以前所讲的, chittpt 的应用开发才是巨大的机会,你觉得呢?
一觉醒来,又一个炸力的大模型上线了,据说和吉比利斯旗鼓相当啊。这是阿联酋推出的一个大模型猎鹰, 他是在三点五万亿个 token 上训练出来的,拥有一千八百亿的参数。这个模型呢,上线不到几天,九尾居哈根 face 排行榜首位啊。据官方称,这个一百八十 b 的模型在各种任务上,比如推理、编码知识表现都非常出色, 超过了迈特刚刚推出的拉姆二模型。在闭月模型测试中呢,它的能力仅次于 gbd 四,而且呢,还可以用来商用,未来很有可能会赶上 gbd 四。现在哈根菲斯上已经有呆萌了。经过浩哥的测试呢, 确实很不错,整体的逻辑和编码都没得说。但是这个一百八十 b 的模型啊,是真的耗钱啊。想要运行起来,需要八张 a, 一百,也就是六百四十 g 的显存啊。 想要进行全面的微调呢,就更耗钱了,需要十六张 a, 一百就是五千一百二十 g 的现存啊。说白了,你要运行这个模型,一小时的成本至少是八十块钱,而训练一小时啊,至少是六百四十块钱。
震惊!这次微软真的要睡不着觉了,谷歌扔出重磅炸弹,首个能和 j v 四对抗的大模型终于诞生了!就在刚刚的谷歌 io 大会上,谷歌发布了有史以来最强大的大模型 pam two, 作为 ai 的带头人,这次谷歌没有像上次发布会一样翻车, 彻彻底底的证明了自己一回全场演示的功能震撼到让我直接惊掉了下巴。让我们回到发布会现场来看看谷歌怕么处的表现到底有多逆天。 首先是语言方面,这次 pam two 一下子支持了一百多种语言,而且对于每一种语言他都通过了高级语言能力考试,并且达到了精通的级别,毫不夸张的说,让他做你的外语老师完全没有压力。在 gbd 四最引以为傲的 逻辑推理能力上,谷歌也首次超越了 gbd 四。我们在谷歌的最新论文中发现, poma 的部分结果已经超越了 gbd 四,可以说这对 gbd 四来说是一个十分重大的打击。还有一点让我感到兴奋的是,谷歌这次发布的模型有四个大小不同 的版本,而体积最小的 k 壳将可以在手机上运行,运行速度很快,每秒可以处理十七个单词,而且离线也可以运行, 就是说开发者不用再花费大量的时间和资源来创建或者调整,他妈还是能够直接拿来就用,这预示着大模型移动化的时代可能真正的开始了。发布会上,谷歌还对标了微软全家桶的办公套件,最新的 gmail 搜索引擎等等,看来这一场巨头间的 ar 大战真的越来越精彩了。
屏幕前的程序员们,你们的工作流要被颠覆了。给他把大会上要用大模型来全面赋能开发者们。首先你基于 j b t 四的全新 compilement chat, 这家伙聪明决定,你可以用自然语言来跟他交流编程问题,立马就能给出代码提示,检查错误、编写测试等,对小白非常友好。 突然有点羡慕计算机专业的大一新生。此次还有专属企业用户的可怕认者版本也即将上线,可以关联企业的代码库,给出超个性化的代码建议和自动化操作,还有和更多的第三方工具去打通,功能强大到爆炸。
ai 模型这么多,你到底要用哪一个?这里通过四个维度来分析,最火的 ai 大模型分别是 gpd 四、 cold、 文心一言和讯飞星火。第一个维度是逻辑题,问树上有十只鸟,射了一枪,死了一只鸟,还剩几只? gpd 四和讯飞都给出了正确答案, 按靠和文件原则算出九只,还好通过再次提问后,他们进行了自我纠错,所以这个环节绝不是适合讯飞星火。邮政, 这个是文案处理,让他们写一个短篇武侠小说,看看他们的文案效果。先看文学一言生成的结果,基本是人物介绍和情节的陈述,比较枯燥。再来看看他的文案,有生动的对话和心理描写,但美中不足的就是文案会出现英文, 而 gpd 四核讯飞星火就能完全理解需求,而讯飞更是给出了两千多字的文案,而其他几个都是一千字左右,所以中文文案 处理方面讯飞优胜。第三个是文件处理,这里用特斯拉的财报让他们进行总结,看谁的回答会更好。来到文心一言和讯飞,他们都成功总结了文档,不过从回答上面看,文心一言的回复更加详细,而且给出了应该怎么向他提问, 对小白来说更友好。而去飞行和总结后就没有提示了,而去 bt 四就像人一样去问你的需求,但怎么问他都总结不出来,所以原声文件处理功能还比较一般。 最后看到 cow, 他甚至分点总结好了财报,观感上面更加的专业有逻辑。同时他还可以实现一次分析多个文件, 而其他模型只能一次性分析一个,所以在文件处理方面靠的是第一名。最后来到专业领域,让他们分析案件。首先是 gbt 四,不仅分析了犯了什么罪,而且同时分析了行为动机以及应该怎么调查,可见非常专业。接着 我是 cos, 分析了罪行的基础上还有人性化的表达,要对被害人进行心理安抚。接着就是文心妍和讯飞星火,文心总结了三点,并推测了他的罪行,而讯飞的回答相对死板,但回答没有问题,但相对于其他三个模型就略逊一筹, 所以该环节 gbt 四胜出,可见国内外的模型还有一定的差距。但这次的对比比较片面,因为不同模型之间的训练数据是不一样的,同时他们各自还有不同的功能, ugbt 有庞大的插件市场可以调用,欧文星岩和讯飞星火则是有特色的插件。但是可以确定的 ai 模型未来是会影响到各行各业,你觉得呢?我是 i 教练 zx, 关注我,带你探索 ai 世界!
有没有人和我一样,试过几次拆 gpt 这种大模型之后就基本把它遗忘在角落了,有些事等到做完了才想起来。好像还可以先问问 gpt 大模型不实用,归根结底还是使用场景和使用便利性的问题。 我说大模型想要普及,就应该跟智能手机深度融合在一起。原因很简单,手机人人有,而且天天都用,要真能完美结合,就能直接服务数亿甚至数十亿的普罗大众。随便设想几个场景,按用户模糊的描述就能找出手机里对应的资料,输入某款产品的密 称型号,就能帮你比较不同平台的售价,一键把会议录音直接转换成会议记要等等。这些现在费时费力才能完成的操作,在未来很可能只需要对大模型助手说一下就能解决了。手机有可能像人类一样思考,这就是现在很多厂商把大模型认为智能手机又一核心技术的根本原因。头部手机厂商基本都 看透了这点,并已经开始了军备竞赛,例如苹果就想尽早将大模型塞进 iphone。 国产手机方面, vivo 更是在近期率先发布了自研蓝星大模型矩阵,用没有上限的投入去推动大模型在手机行业的落地。为了让大模型真正落地, vivo 组建了千人规模的 ai 专家团队,二零一八年就成立人工智能图谱研究, 同年推出 ai 语音助手周魏。经过五年的技术研发和超大量多模态数据积累,终于换来了今天蓝心大模型的亮相。 vivo 蓝心大模型研发的思路除了追求参数量大,还非常在意用户的数据安全,因为手机里的大模型要好用, 肯定需要读取用户的信息,最安全的方式肯定是在本地进行计算,而不是把信息传到云端。所以 vivo 一次开发了五款大模型,包含十亿、百亿、千亿三个参数量级。千亿级大模型在云端运算应对更复杂和更专业的 需求。十亿级模型主要面向端侧,七十亿模型则是面向手机的端云两用模型。他们可以在手机本地运行,保证数据更安全的同时,除此速度、响应、时间、内存占用等方面也具有优势。而开发这种能在手机端运行的大模型,手机厂商是有天然优势的。他们更清除手机芯片硬件性能的天花板, 也擅长在软硬件协同方面进行调试。这种天时地利加上更早的布局,让蓝星大模型在多个榜单中拿到十亿级参数大模型的第一名。并见之外, vivo 最近还发布了自研的蓝和操作系统,并引入了蓝星大模型能力, 支持复杂的意图识别和交互方式,这也让他们可以从底层为第三方 app 开发商提供使用大模型的接口,拓宽大模型在智能穿戴、智能家居等多领域的应用场景。十几年前的功能机时代,我们无法想象智能操作系统、高算力芯片以及四 五 g 通信网络能让手机变成我们的数字分身。所以现在我们对 ai 大模型的想象可能还是趋于保守了,他未来可能会让手机成为专属于每一个普通人的会思考的助力和管家。而现在 vivo 的蓝星大模型,或许就让我们离这样的未来更近了一步。
chat gpt 四点零真的在这个地球上已经无敌了吗?今天的这个视频内容啊,绝对可以颠覆所有讲人工智能类的视频的内容,月份啊,也没多少天了,华为呢,就会发布一款产品,这是一款我们国内完全的这个自主知识产权的人工智能的大模型啊,对,标的就是老美的 chat gpt 四, 根据公开的这些信息和一些我的一些投研的信息啊,目前推出这个产品啊,在某些方面应该会要超越老美的这个产品。 最近几天啊,我也是找到了国内这方面的一个顶级的专家啊,他说啊,其实我们总体的这个差距呢,并不是很大,但是像华为的这个盘古的产品呢,有可能在某些方面还会领先国外,这是他的原话,他也讲到了咱们国内的一些企业在做的, 目前在做的一些公司啊,具体公司我就不一一点名了。差距呢还是有个两到三年,因为他们都是外购芯片,而且芯片的这个投入呢,需要 巨额的资金,而且现在老美那边还不给最先进的芯片给到咱们,所以呢就会限制发展,但是华为不一样,完全是自主可控。他说啊,二零一二年华为就立向在做了,人家华为都是在默默的前行,低调到很多人都不知道华为也做人工智能, 他说了一组数据,让我特别的震惊啊,那就是二零二一年,也就是啊,前年华为已经做到了两千亿的这个算力, 那个时候已经领先了国外的 gpt 的这个三点零一千七百五十亿的算力。而且他还说这次发布的新产品的算力起码是一二年那个时候的五倍啊,将会超过万亿的算力规模,有可能会遥遥领先全球所有的 ai 大模型。这个盘古那就是真的是一推出就是开天辟地啊, 我觉得此处应该有掌声啊,让我们为华为长安点赞一波,让正能量传递给更多的人。抬高 告诉我,这个盘古大模型啊,并不是一直处于这个试验试阶段,而是一直在使用,其实很早就用在华为产业链上面的这些相关的公司进行测试,只是还没有对个人的这个用户啊去使用罢了,所以一直很低调。 盘古呢,一直在华为的云端搜集和跑数据学习,鸿蒙的三点零就是他的一个运动。盘古大模型的这个架构底层的 ai 算力完全是由华为自己研发的这个鹏鹏芯片和服务器来提供, 即使华为目前还没有七纳米以内的自主制造的这个芯片,丝毫也不影响华为还和我们中国最大的超算中心合作,在大模型方面,算力并不是他们的一个瓶颈, 而是绰绰有余啊。其实大家发现没有,华为如果要发布一个产品商用,那基本上就是打磨已经非常成熟了,而且是有很独到的一个技术推出,不管是手机还是平板还是其他的电子产品,只要发布了,都会有很多类 领先竞品的这么些创新。所以啊,中国真正牛逼的大模型可能还得靠华为。四月十七号华为最新的发布会上,这个盘古大模型啊可能就会发布,让我们拭目以待。
格式最强竞争模型科二大震撼登场,他是 annoy 公司发布的机语 transformer 架构的大语言模型,被赞誉为最接近叉 cupt 的商业产品。科二大在 codex humani 上的表现显著提升,编码能力从百分之五十六点零增长至百分之七十一点二,远超竞争对手, 支持高达十万偷看人士输入和四千个偷看人士的输出,超越 x 的三十二 k 预值。逻辑推理能力更强,回答更为无害,安全可靠。对中文的全面支持使得克拉达人更好的理解用户意图,表现出卓越的意图理解能力。采用了全新的训练数据, 使用二零二三年初的最新数据来训练模型,使得模型性能得以持续优化。克拉蔡底开放给 usi uk 地区的用户免费使用,目前仅支持该地区。接下来我们将演示如何操作。使用 clad。 首先打开这 这个链接,然后点击下方注册,或者用谷歌账号快捷登录,然后填写你的名称,同选项打勾,接着 ctrl 继续,然后点击 next, 再次点击 next, 再一次点击 next, 最后点击编辑完成。 然后我们进入这个页面,选择所需的文件格式,罗文、 dst、 pdf 等。在这里,我将要上传了一本关于使用教程的 pdf 电子书,耐心等待上传完成。 上传成功后即可提问。我向科二大提问,请总结一下文档的主要内容。科拉二瞬间给出了精准的总结,然后我请科二大介绍一下他的使用技巧。科二大迅速整理出文档中的八条关于有效交互的技巧。 科奥特不仅性能卓越,而且镜面友好,易上手,无论您是在工作中需要一款高效的工具,赶快去体验一下吧!