News

Weekly Digest: USD Winning Streak, Apple Shares Tumble

Sora关键技术逆向工程图解

Sora 生成的视频效果好吗?确实好。Sora 算得上 AGI 发展历程上的里程碑吗?我个人觉得算。我们知道它效果好就行了,有必要知道 Sora 到底是怎么做的吗?我觉得最好是每个人能有知情的选择权,任何想知道的人都能够知道,这种状态比较好。那我们知道 Sora 到底是怎么做出来的吗?不知道。马斯克讽刺 OpenAI 是 CloseAI,为示道不同,转头就把 Grok 开源了。且不论 Grok 效果是否足够好,马斯克此举是否有表演成分,能开源出来这行为就值得称赞。OpenAI 树大招风,目前被树立成技术封闭的头号代表,想想花了上亿美金做出来的大模型,凭啥要开源?不开源确实也正常。所谓 “开源固然可赞,闭源亦可理解”。但是,我个人一年多来的感觉,OpenAI 技术强归强,然而有逐渐把技术神秘化的倾向,如果不信您可以去读一下 Altman 的各种访谈。在这个 AI 技术越来越封闭的智能时代,技术神秘化导向的自然结果就是盲目崇拜,智能时代所谓的 “信息平权” 或只能成梦想。我不认为这是一个好的趋势,我发自内心地尊敬对技术开放作出任何贡献的人或团体,且认为对技术神秘化的去魅,这应该是 AI 技术从业者值得追求的目标。本文试图尽我所能地以通俗易懂的方式来分析 Sora 的可能做法,包括它的整体结构以及关键组件。我希望即使您不太懂技术,也能大致看明白 Sora 的可能做法,所以画了几十张图来让看似复杂的机制更好理解,如果您看完对某部分仍不理解,那是我的问题。 Key Messages 这部分把本文关键信息列在这里,特供给没空或没耐心看长文的同学,当然我觉得您光看这些估计也未必能看明白。Key Message…

Continue reading

Sam Altman 表示巨型 AI 模型的时代已经结束

几个月来,ChatGPT聊天机器人,引发了人们对人工智能的新兴趣以及投资热情。但是上周末,OpenAI 的首席执行官警告人们说,虽然他们发明了ChatGPT,但是这种聊天机器人的研发策略已经结束。 目前,需要共同探索未来的新方向,但谁也不知道新的奇点来自何方。 近几年来, OpenAI通过采用现有的机器学习算法,并将其扩展到以前人们无法想象的规模,本次在与自然语言一起工作的人工智能方面,已经取得了一系列印象深刻的进步。 GPT-4 是这些技术中最新的一个,它用数万亿个文本单词和数千个功能强大的计算机芯片进行训练,该过程已经耗资超过 1 亿美元。 OpenAI 的首席执行官萨姆奥特曼(Sam Altman)表示,未来新一步的进化,将不会来自于巨型模型。 他说:“我认为我们正处于时代的末尾,这个时代就是这些内容了。比如大模型、巨型模型”。他上周的晚些时候,在麻省理工学院举行的一次活动中告诉观众们。“我们会以其它方式让GPT变得更好。” Altman 的声明表示在开发和部署新 AI 算法的竞赛中出现了意想不到的转折。 自从 OpenAI 在去年 11 月推出 ChatGPT 以来,微软利用其底层技术为其 Bing 搜索引擎添加了聊天机器人,而谷歌则推出了名为 Bard 的聊天机器人与其竞争。 从诞生开始,许多人便急于尝试使用新型聊天机器人来帮助完成自己的工作或其它任务。 与此同时,包括Anthropic、  AI21、  Cohere和 Character.AI在内的众多资金充足的初创公司正在投入大量资源来构建更大的算法和模型,以期待努力赶上 OpenAI 的技术。…

Continue reading

Prices On Gold And Silver Gold Price Today See how gold spot prices have been trending. This interactive graph shows the value of gold, silver, platinum, and palladium on a specific day, week, month, or…

Continue reading

OpenAI 文本嵌入式模型之初学者指南

Click:sustainable design 向量嵌入在人工智能中至关重要,它可以将复杂的非结构化数据转换为机器可以处理的数字向量。这些嵌入可以捕获数据中的语义含义与关系,从而实现更有效的分析和内容生成。 ChatGPT 的所属企业 OpenAI 提供了多种嵌入模型,这些模型可提供高质量的向量表示,可用于各种应用程序,包括语义搜索、聚类和异常检测。本指南将探讨如何利用 OpenAI 的文本嵌入模型来构建智能且响应迅速的 AI 系统。 何为向量嵌入与嵌入模型? 在我们深入讨论这些之前,先来了解几个术语。首先,什么是向量嵌入?它们是许多 AI 概念的基石。向量嵌入是数据的数字表示,特别是文本、视频、音频、图像和其他数字媒体等非结构化数据。它们捕捉数据中的语义含义和关系,并为存储系统和 AI 模型提供一种有效的方式来理解、处理、存储和检索复杂且高维的非结构化数据。 那么,如果嵌入是数据的数字表示,那么如何将数据转换为向量嵌入?这就是嵌入模型的作用所在。 嵌入模型是一种将非结构化数据转换为向量嵌入的专门算法。它的目标是在于学习数据中的模式和关系,然后在高维空间中表达它们。其关键思想是相似的数据将具有相似的向量表示,并且在高维空间中彼此更接近,从而使 AI 模型能够更有效地处理和分析数据。 比如,在自然语言处理 (NLP) 的背景下,嵌入模型可能会了解到单词“king”和“queen”是相关的,并且应该在向量空间中彼此靠近,而单词“banana”则应该放在较远的位置。 向量空间中的这种接近性反映了单词之间的语义关系。 嵌入模型和向量嵌入的常见用途是在检索增强生成( RAG ) 系统中。 RAG 系统并非仅仅依赖大型语言模型( LLM ) 中的预训练知识,而是在生成输出之前为 LLM 提供额外的上下文信息。这些额外的数据使用嵌入模型转换为向量嵌入,然后存储在Milvus等向量数据库中(它也可通过Zilliz Cloud作为完全托管的服务提供)。…

Continue reading

Neuralink:马斯克将把芯片植入大脑

这位亿万富翁现在做出了可能是他迄今为止最雄心勃勃的商业承诺。 过去的时光里,马斯克曾大胆预测特斯拉的 Cybertruck 将在今年投产(剧透:目前没有),如果有必要,他会制造自己的智能手机(剧透:他可能不会)。 据说马斯克的生物技术公司 Neuralink 很快将开始对人类志愿者进行研究,该公司开发脑芯片以帮助恢复残废人身体的部分功能。 有海外的技术社区伙伴讨论了 Elon Musk 的伟大计划,NeuraLink 这家公司即将在人脑中测试和植入神经链接芯片。 以下是Valentine Enedah、Mahipal Nehra、Sara Pinto (萨拉平托)和 Mónica Freitas(莫妮卡弗雷塔斯) 几个人以讨论的方式对Neuralink以及马斯克做了一番讨论,以下按信息流的时间线展示。 (为便于阅读进行了部分编辑) Neuralink 即将在人脑中测试芯片! Keyword: ChatGPT