img

引言

今天,我们宣布推出 Claude 3 模型系列,它为广泛的认知任务树立了新的行业基准。该系列包括三种最先进的型号(按功能升序排列):Claude 3 Haiku、Claude 3 Sonnet 和 Claude 3 Opus。每个后续型号都提供越来越强大的性能,允许用户为其特定应用选择智慧、速度和成本的最佳平衡。

Opus 和 Sonnet 现已可在 claude.ai 中使用,而 Claude API 现已在159 个国家/地区广泛使用。俳句即将推出。

克劳德3模型家族

img

智慧的新标准

Opus 是我们最聪明的模型,在人工智慧系统的大多数常见评估基准上都优于同行,包括本科水平专家知识 (MMLU)、研究生水平专家推理 (GPQA)、基础数学 (GSM8K) 等。它在复杂任务上表现出接近人类层面的理解和流畅性,引领通用智慧的前沿。

所有Claude 3模型都显示出在分析和预测、细致内容创建、代码生成以及西班牙语、日语和法语等非英语语言对话方面的增强能力。

以下是 Claude 3 模型与我们的同侪模型在多个效能基准 [1] 上的比较:

img

近乎即时的结果

Claude 3 模型可以支援即时客户聊天、自动完成和资料提取任务,其中回应必须立即且即时。

Haiku 是智慧类别市场上速度最快且最具成本效益的型号。它可以在不到三秒的时间内阅读 arXiv 上包含图表和图形的资讯和数据密集的研究论文(约 10k 代币)。发布后,我们期望进一步提高效能。

对于绝大多数工作负载,Sonnet 的速度比 Claude 2 和 Claude 2.1 快 2 倍,且智慧等级更高。它擅长执行需要快速回应的任务,例如知识检索或销售自动化。Opus 的速度与 Claude 2 和 2.1 相似,但智慧等级更高。

强大的视觉能力

Claude 3 型号具有与其他领先型号相当的复杂视觉功能。他们可以处理各种视觉格式,包括照片、图表、图形和技术图表。我们特别高兴能够为我们的企业客户提供这种新模式,其中一些客户的知识库高达 50% 以各种格式编码,例如 PDF、流程图或简报投影片。

img

更少的拒绝

以前的克劳德模型经常做出不必要的拒绝,这表明缺乏语境理解。我们在这一领域取得了有意义的进展:与前几代模型相比,Opus、Sonnet 和 Haiku 拒绝回答接近系统护栏的提示的可能性明显降低。如下所示,Claude 3 模型对请求表现出更细致的理解,能够识别真正的伤害,并且拒绝回答无害提示的频率要少得多。

img

提高准确性

各种规模的企业都依赖我们的模型来为其客户提供服务,因此我们的模型输出必须保持大规模的高精度。为了评估这一点,我们使用了大量复杂的事实问题来针对目前模型中已知的弱点。我们将答案分为正确答案、错误答案(或幻觉)和承认不确定性,其中模型表示它不知道答案,而不是提供不正确的资讯。与 Claude 2.1 相比,Opus 在这些具有挑战性的开放式问题上的准确性(或正确答案)提高了一倍,同时也减少了错误答案的水平。

除了产生更值得信赖的回复之外,我们很快还将在 Claude 3 模型中启用引用,以便他们可以指向参考材料中的精确句子来验證他们的答案。

img

长上下文与近乎完美的回忆

Claude 3 系列型号在发布时最初将提供 200K 上下文视窗。然而,所有三种型号都能够接受超过 100 万个代币的输入,我们可能会将其提供给需要增强处理能力的精选客户。

为了有效地处理长上下文提示,模型需要强大的回忆能力。「大海捞针」(NIAH)评估衡量模型从大量数据中准确回忆资讯的能力。我们透过在每个提示中使用 30 个随机针/问题对之一并在不同的众包文档库上进行测试,增强了该基准的稳健性。Claude 3 Opus 不仅实现了近乎完美的召回率,超过99% 的准确率,而且在某些情况下,它甚至通过识别“针”这句话似乎是人类人为插入到原文中来识别评估本身的局限性。

img

负责任的设计

我们开发的 Claude 3 系列型号不仅功能强大,而且值得信赖。我们有几个专门的团队来追踪和减轻广泛的风险,从错误讯息和 CSAM 到生物滥用、选举干扰和自主复制技能。我们继续开发宪法人工智慧等方法来提高模型的安全性和透明度,并调整我们的模型以减轻新模式可能引发的隐私问题。

解决日益复杂的模型中的偏差是一项持续的努力,我们在这个新版本中取得了长足的进步。如模型卡所示,根据问答 (BBQ) 偏差基准,Claude 3 显示的偏差比我们之前的模型少。我们仍然致力于改进技术,减少偏见并促进我们的模型更加中立,确保它们不偏向任何特定的党派立场。

虽然与先前的模型相比,Claude 3 模型系列在生物知识、网络相关知识和自主性的关键指标方面取得了进步,但根据我们的负责任的扩展政策,仍处于AI 安全级别2 (ASL- 2) 。我们的红队评估(根据我们的白宫承诺2023 年美国行政命令进行)的结论是,这些模型目前带来灾难性风险的可能性可以忽略不计。我们将继续仔细监控未来的模型,以评估它们是否接近 ASL-3 阈值。更多安全细节请参阅Claude 3 模型卡

更容易使用

Claude 3 模型更擅长遵循复杂的多步骤指令。他们特别擅长遵守品牌声音和回应准则,并开发用户可以信赖的面向客户的体验。此外,Claude 3 模型更擅长以 JSON 等格式产生流行的结构化输出,从而可以更轻松地指导 Claude 进行自然语言分类和情感分析等用例。

型号详情

Claude 3 Opus是我们最聪明的模型,在高度复杂的任务上具有市场最佳的表现。它可以以惊人的流畅性和类似人类的理解能力来导航开放式提示和看不见的场景。Opus 向我们展示了生成式人工智慧的外部极限。

**成本 ***[输入美元/百万代币| 输出$/百万代币]* $15 | $75
上下文视窗 20万*
潜在用途 任务自动化:跨 API 和资料库规划和执行复杂的操作、互动式编码研发:研究回顾、集思广益与假设生成、药物发现策略:图表、财务和市场趋势的高阶分析、预测
差异化因素 比任何其他可用型号更高的智慧。

Claude 3 Sonnet在智慧和速度之间实现了理想的平衡,特别是对于企业工作负载。与同类产品相比,它以更低的成本提供强大的性能,并且专为大规模人工智慧部署中的高耐用性而设计。

**成本 ***[输入美元/百万代币| 输出$/百万代币]* $3 | $15
上下文视窗 20万
潜在用途 资料处理:RAG 或对大量知识的搜寻和检索销售:产品推荐、预测、定向行销节省时间的任务:程式码生成、品质控制、从图像中解析文本
差异化因素 比其他同类智慧型机型更实惠;更适合规模化。

Claude 3 Haiku是我们最快、最紧凑的模型,具有近乎即时的响应能力。它以无与伦比的速度回答简单的查询和请求。用户将能够建立模仿人类互动的无缝人工智慧体验。

**成本 ***[输入美元/百万代币| 输出$/百万代币]* $0.25 | $1.25
上下文视窗 20万
潜在用途 客户互动:即时互动、翻译中快速、准确的支持内容审核:捕捉危险行为或客户请求节省成本的任务:优化物流、库存管理、从非结构化资料撷取知识
差异化因素 比同类智慧产品中的其他型号更聪明、更快速且更实惠。

型号可用性

Opus 和 Sonnet 现在可以在我们的 API 中使用,该 API 现在已普遍可用,使开发人员能够立即注册并开始使用这些模型。俳句即将推出。Sonnet 正在为 claude.ai 提供免费体验,Opus 可供 Claude Pro 订阅者使用。

Sonnet 现已透过 Amazon Bedrock 提供,并在 Google Cloud 的 Vertex AI Model Garden 上提供私人预览版,Opus 和 Haiku 也即将推出。

更聪明、更快、更安全

我们认为模型智慧还没有达到极限,我们计划在未来几个月内频繁发布 Claude 3 模型系列的更新。我们也很高兴发布一系列功能来增强我们模型的功能,特别是对于企业用例和大规模部署。这些新功能将包括工具使用(又称函数呼叫)、互动式编码(又称 REPL)和更高级的代理功能。

当我们突破人工智慧能力的界限时,我们同样致力于确保我们的安全护栏跟上这些效能飞跃的步伐。我们的假设是,处于人工智慧发展的前沿是引导其走向积极社会成果的最有效方式。

我们很高兴看到您使用 Claude 3 创作的作品,并希望您能给我们回馈,让 Claude 成为更有用的助手和创意伴侣。要开始与 Claude 一起构建,请访问anthropic.com/claude

注脚

  1. 该表显示了与目前已发布评估的商用模型的比较。我们的型号卡显示了与已宣布但尚未发布的型号(例如 Gemini 1.5 Pro)的比较。此外,我们还想指出,工程师一直在努力优化评估提示和少量样本,并为较新的 GPT-4T 模型报告了更高的分数。

Claude 3 如何注册和使用

在官网注册账号 打开claude官网https://claude.ai/,输入你的邮箱进行注册,你可以使用国内邮箱,或者直接使用google邮箱注册,推荐使用google邮箱,方便快捷。但是没有google邮箱也不要慌,国内邮箱也可以注册:

img

登录邮箱获取验证码,输入验证码,

img

验证通过,下一步输入手机号码进行验证

划重点,很多人卡在这一步,因为没有国外的手机号码,这里推荐注册Wildcard,可以获得3次海外手机验证码。

使用Wildcard获取海外手机验证码

这里介绍使用手机上的浏览器获取海外手机验证码的方法

  • 注册完wildcard之后,点击我的服务,找到海外手机号,点击使用,会弹出下面的界面,点击申请手机号。

img

  • 这里可以使用手机号注册Claude2和OpenAI的账号,我们选择Claude2.

img

  • 下面是一个提示,点继续。

img

  • 接着就会显示本次申请到的海外手机号,和这个手机号所属的国家。

img

  • 接下来回到Claude的注册画面,,以上面的手机号为例,选择国家为英国,也就是United Kingdom,不要输入+44,输入那串黑色的数字,,点击Send Verification Code。注意,你有可能会像下图一样,遇到Phone number already used.Please try a different phone number.的错误,也就是说,电话号码已经被使用,建议换一个号码,不要慌我们看下面的解决办法。

img

  • 我们回到wildcard的申请手机号码页面,点击申请新号码,马上就会生成一个新号码

img

  • 把新号码填到Claude的注册画面里,点击Send Verification Code。

img

  • 没有提示手机号码被占用,那就稍等片刻,手机上wildcard的画面上就会收到短信验证码,这个验证码也会以短信的形式同步发送到你注册wildcard所使用的手机号上。

img

  • 把验证码输入上面的框,勾选已满18岁的框,点击Verify&Create Account,来验证并创建账号。

img

验证通过就可以开始使用Claude了。 整体使用跟国内的大模型界面比较类似,跟chatGPT还是有一些区别的。

img

Claude 充值

免费版的Claude会限制速度,稍微问两句就会提示要充钱。这时候也可以使用Wildcard进行充值,接着体验你的Claude 3之旅。

(PS: Wildcard虚拟卡也可以用来升级ChatGPT Plus哦,而且超级简单超级方便,具体可以看教程如何购买ChatGPT Plus?信用卡付款失败怎么办?使用虚拟信用卡升级ChatGPT Plus 指南)

原官网文章:

一、ChatGPT账号注册相关

国内ChatGPT账号怎么注册,无需手机验证码(2024年2月更新)

二、ChatGPT充值升级 Plus

如何购买ChatGPT Plus?信用卡付款失败怎么办?使用虚拟信用卡升级ChatGPT Plus 指南

三、Youtube、Onlyfans等国外优质服务订阅:

OnlyFans支付教程,手把手教你使用虚拟信用卡订阅 Onlyfansonlyfans虚拟信用卡支付教程-Onlyfans保姆级教程

四、科技前沿:

什么是Sora?如何使用?新手小白必看