Anthropic 公司最新宣布,他们的 AI 聊天机器人模型击败了 OpenAI 的 GPT-4
每周跟踪AI热点新闻动向和震撼发展 想要探索生成式人工智能的前沿进展吗?订阅我们的简报,深入解析最新的技术突破、实际应用案例和未来的趋势。与全球数同行一同,从行业内部的深度分析和实用指南中受益。不要错过这个机会,成为AI领域的领跑者。点击订阅,与未来同行! 订阅:https://rengongzhineng.io/
AI初创公司Anthropic,背靠谷歌和数亿美元的风险投资(很可能很快还会增加数亿美元),今天宣布了其最新一代人工智能技术Claude的发布。该公司声称,这款AI聊天机器人在性能上超越了OpenAI的GPT-4。
Anthropic的新一代AI,名为Claude 3,包含了多个模型——Claude 3 Haiku、Claude 3 Sonnet和Claude 3 Opus,其中Opus是最强大的。Anthropic声称,所有这些模型在分析和预测方面都显示出了“增强的能力”,在特定基准测试中的表现也优于像ChatGPT和GPT-4,以及谷歌的Gemini 1.0 Ultra(但不包括Gemini 1.5 Pro)。
值得注意的是,Claude 3是Anthropic首款多模态的人工智能,意味着它可以分析文本和图片——类似于GPT-4和Gemini的某些版本。Claude 3可以处理照片、图表、图形和技术图纸,能够从PDF、幻灯片和其他文档类型中提取信息。
与一些人工智能竞争对手相比,Claude 3在一个方面做得更好,那就是可以在单个请求中分析多张图片(最多20张)。这使得它能够比较和对比图片,如Anthropic所述。
但是,Claude 3在图像处理方面也有其限制。
Anthropic已禁用模型识别人物——无疑是出于对伦理和法律影响的考虑。公司承认,Claude 3在处理“低质量”图片(低于200像素)时容易出错,并且在涉及空间推理(例如,读取模拟时钟面)和对象计数(Claude 3不能准确计算图像中的对象数量)的任务上存在困难。
至少目前而言,Claude 3也不会生成艺术作品。模型严格用于图像分析。
不论是处理文本还是图像,Anthropic表示,客户通常可以期待Claude 3比其前代模型更好地遵循多步骤指令,产生像JSON这样的结构化输出,并且能够使用英语之外的语言进行对话。得益于“对请求更加细腻的理解”,Claude 3应该更少地拒绝回答问题。不久后,模型还将引用其回答问题的来源,以便用户可以验证。
Anthropic在一篇支持文章中写道:“Claude 3倾向于生成更具表现力和吸引力的回应,”“与我们的旧模型相比,它更易于提示和引导。用户应该发现,他们可以使用更短、更简洁的提示来达到所需的结果。”
这些改进部分源于Claude 3的扩展上下文。
模型的上下文,或上下文窗口,指的是模型在生成输出之前考虑的输入数据(例如,文本)。具有小上下文窗口的模型倾向于“忘记”即使是非常近期的对话内容,导致它们偏离主题——经常以问题性的方式。作为一个额外的好处,大上下文模型可以更好地把握它们所接收的数据的叙事流,并生成更富有上下文的回应(至少理论上是这样)。
Anthropic表示,Claude 3最初将支持200,000令牌的上下文窗口,相当于约150,000个单词,某些客户将获得高达1,000,000令牌的上下文窗口(约700,000个单词)。这与谷歌最新的人工智能模型Gemini 1.5 Pro相当,后者也提供了高达一百万令牌的上下文窗口。
然而,仅仅因为Claude 3比之前的版本有所提升,并不意味着它是完美的。
在一篇技术白皮书中,Anthropic承认Claude 3并非免疫其他人工智能模型所面临的问题,即偏见和幻觉(即,编造事实)。与某些人工智能模型不同,Claude 3不能搜索网络;模型只能使用2023年8月之前的数据回答问题。而且,虽然Claude支持多种语言,但它在某些“低资源”语言上的流利程度不及英语。
但Anthropic承诺将在接下来的几个月中频繁更新Claude 3。
“我们并不认为模型智能已经达到其极限,我们计划在接下来的几个月内发布Claude 3模型家族的[增强功能],”公司在博客文章中写道。
Opus和Sonnet现已通过网页、Anthropic的开发控制台和API、亚马逊的Bedrock平台以及谷歌的Vertex AI提供。Haiku将于今年晚些时候推出。
以下是定价细节:
Opus:每百万输入令牌15美元,每百万输出令牌75美元 Sonnet:每百万输入令牌3美元,每百万输出令牌15美元 Haiku:每百万输入令牌0.25美元,每百万输出令牌1.25美元 那么,Claude 3的全局观是什么呢?
嗯,正如我们之前报道的,Anthropic的雄心是创造一个下一代的“AI自我教学”算法。这样的算法可以用来构建虚拟助手,它们可以回答电子邮件、执行研究、生成艺术品、书籍等——我们已经通过GPT-4和其他大型语言模型尝试了其中的一些功能。
Anthropic在上述博客文章中暗示了这一点,称它计划添加使Claude 3具备开箱即用能力的功能,通过让Claude与其他系统交互、"交互式"编码和提供"高级代理能力"。
这最后一点让人想起OpenAI报道的雄心,即建立一个软件代理来自动执行复杂任务,如将数据从文档转移到电子表格或自动填写费用报告并将其输入会计软件。OpenAI已经提供了一个API,允许开发人员将“代理式体验”构建到他们的应用中,而Anthropic似乎也致力于提供可比的功能。
我们能从Anthropic那里看到图像生成器吗?坦白说,我会感到惊讶。如今,图像生成器是许多争议的主题,主要是出于版权和偏见相关的原因。谷歌最近被迫禁用了其图像生成器,因为它以对历史背景的滑稽无视注入了多样性。而且,一些图像生成器供应商正在与艺术家进行法律斗争,这些艺术家指控他们通过在未提供补偿或甚至信用的情况下,使用他们的作品训练GenAI而获利。
我很好奇看到Anthropic训练GenAI的技术进化,“宪法AI”,该公司声称使其GenAI的行为更易于理解、更可预测并且需要时更简单地调整。宪法AI旨在提供一种方式,使AI与人类意图对齐,让模型使用一组简单的指导原则回答问题和执行任务。例如,对于Claude 3,Anthropic表示,它添加了一个原则——根据众包反馈——指导模型对残疾人士表现出理解并易于接近。
无论Anthropic的最终目标是什么,它都在长期规划中。根据去年5月泄露的一份推介文稿,该公司计划在未来12个月左右的时间里筹集高达50亿美元——这可能只是它需要保持与OpenAI竞争的基线。(毕竟,训练模型并不便宜。)它已经在谷歌和亚马逊分别承诺的资本和承诺中分别获得了20亿美元和40亿美元,以及其他支持者合计超过十亿美元。