Articles from November 2024

Apparel Shoe Gift & Accessories Show 2024

OpenAI 文本嵌入式模型之初学者指南

Click:sustainable design 向量嵌入在人工智能中至关重要,它可以将复杂的非结构化数据转换为机器可以处理的数字向量。这些嵌入可以捕获数据中的语义含义与关系,从而实现更有效的分析和内容生成。 ChatGPT 的所属企业 OpenAI 提供了多种嵌入模型,这些模型可提供高质量的向量表示,可用于各种应用程序,包括语义搜索、聚类和异常检测。本指南将探讨如何利用 OpenAI 的文本嵌入模型来构建智能且响应迅速的 AI 系统。 何为向量嵌入与嵌入模型? 在我们深入讨论这些之前,先来了解几个术语。首先,什么是向量嵌入?它们是许多 AI 概念的基石。向量嵌入是数据的数字表示,特别是文本、视频、音频、图像和其他数字媒体等非结构化数据。它们捕捉数据中的语义含义和关系,并为存储系统和 AI 模型提供一种有效的方式来理解、处理、存储和检索复杂且高维的非结构化数据。 那么,如果嵌入是数据的数字表示,那么如何将数据转换为向量嵌入?这就是嵌入模型的作用所在。 嵌入模型是一种将非结构化数据转换为向量嵌入的专门算法。它的目标是在于学习数据中的模式和关系,然后在高维空间中表达它们。其关键思想是相似的数据将具有相似的向量表示,并且在高维空间中彼此更接近,从而使 AI 模型能够更有效地处理和分析数据。 比如,在自然语言处理 (NLP) 的背景下,嵌入模型可能会了解到单词“king”和“queen”是相关的,并且应该在向量空间中彼此靠近,而单词“banana”则应该放在较远的位置。 向量空间中的这种接近性反映了单词之间的语义关系。 嵌入模型和向量嵌入的常见用途是在检索增强生成( RAG ) 系统中。 RAG 系统并非仅仅依赖大型语言模型( LLM ) 中的预训练知识,而是在生成输出之前为 LLM 提供额外的上下文信息。这些额外的数据使用嵌入模型转换为向量嵌入,然后存储在Milvus等向量数据库中(它也可通过Zilliz Cloud作为完全托管的服务提供)。…

Continue reading

Neuralink:马斯克将把芯片植入大脑

这位亿万富翁现在做出了可能是他迄今为止最雄心勃勃的商业承诺。 过去的时光里,马斯克曾大胆预测特斯拉的 Cybertruck 将在今年投产(剧透:目前没有),如果有必要,他会制造自己的智能手机(剧透:他可能不会)。 据说马斯克的生物技术公司 Neuralink 很快将开始对人类志愿者进行研究,该公司开发脑芯片以帮助恢复残废人身体的部分功能。 有海外的技术社区伙伴讨论了 Elon Musk 的伟大计划,NeuraLink 这家公司即将在人脑中测试和植入神经链接芯片。 以下是Valentine Enedah、Mahipal Nehra、Sara Pinto (萨拉平托)和 Mónica Freitas(莫妮卡弗雷塔斯) 几个人以讨论的方式对Neuralink以及马斯克做了一番讨论,以下按信息流的时间线展示。 (为便于阅读进行了部分编辑) Neuralink 即将在人脑中测试芯片! Keyword: ChatGPT

“开卷有益”续写新的故事

  随着大数据、云计算、人工智能和区块链等新技术广泛应用,“一屏万卷”的数字阅读时代已经到来。   24日,在杭州举办的第二届全民阅读大会上,中国音像与数字出版协会发布《2022年度中国数字阅读报告》。报告显示,2022年我国数字阅读市场总体营收规模为463.52亿元,同比增长11.5%,数字阅读用户规模达5.30亿,较上年增加2400万。产业规模稳步增长、价值引领态势向好、业态模式持续创新、阅读需求快速释放、海外布局逐年推进……数字阅读,更加注重提质增效。   从“一书在手”到“一屏万卷”,乘着数字化翅膀,阅读获得更具沉浸感、更加多元化的体验,“开卷有益”正在续写新的故事。   撑起全民阅读“半边天”   经过多年发展,数字阅读已经是一个“大家族”。根据报告,数字阅读,包括电子阅读和有声阅读两种主要阅读形式。其中,电子阅读又可分为电子书阅读和网络原创文学作品阅读;有声阅读包括有声书阅读、广播剧(节目)和在线课程三种主要形式。   据统计,2022年,我国数字阅读用户中,男性用户占比55.87%,女性用户占比44.13%;19至45岁为数字阅读用户主力,占比为67.15%,活跃度和参与度都保持着较高水平;60岁以上人群占比相较上年增长超过一倍,成为亮点;在校学生占比最高,达53.41%。   数字阅读正在逐步撑起全民阅读“半边天”。   “从互联网到移动互联网,再到下一代互联网,人类的生活方式已然发生了根本性变化,体现在阅读习惯上,就是由纸质阅读为主逐渐发展为以数字阅读为主。对于当下很多年轻人来说,这一点尤为明显。”中国传媒大学互联网信息研究院专任研究员李安说。   “2022年阅文新增用户中,66%为‘95后’读者。”阅文集团总裁侯晓楠表示,数字阅读成为全民阅读的重要组成部分,尤其在年轻读者中影响深远。   什么内容最受青睐   2022年,中国数字阅读平台上架作品总量已达5271.86万部,其中网络文学作品达3458.84万部,有声阅读作品达1518.62万部。   哪些类型的作品最受读者喜爱?报告显示,在网络文学作品中,古代现代言情、都市职场和玄幻奇幻是排名前三的题材类型。在电子书阅读中,教育文化、科学技术和生活百科类作品取代人物传记、教材教辅和经济管理,位居前列。报告还发现,历史军事类题材首次进入60岁以上年龄人群阅读偏好前五位,在46至60岁阅读人群中也上升至第二位。   中国音像与数字出版协会第一副理事长张毅君介绍,我国数字阅读行业优质内容供给持续扩大,数字文化消费渐成主流。   海外“追更”中国网文   “前段时间,我们收到了一位日本读者的来信,整整4页用汉字手写,讲述了这位读者一边学习汉语,一边把中国的网络文学作品翻译成了日语。这封信感动了许多网友,这就是好作品、好故事的力量。”侯晓楠说。   报告显示,数字阅读出海作品总量快速增长。2022年,我国数字阅读出海作品总量为61.81万部(种),相比2021年增长超过50%。北美、日韩以及东南亚地区依旧是“出海”作品投放量最大区域。   张毅君指出,数字阅读作品已成为新时代展现中国形象、提升中华文化影响力的一种新的符号和表现形式,成为提升中华文化海外传播力的重要力量。   专家认为,数字阅读海外市场正进入深度开发阶段,数字阅读企业在加大作品输出的同时更为注重精品化、本土化和差异化的作品打造,用优质IP带动更多类型文化品种“出海”。   数字阅读“无处不在”   在本届大会上,中国移动咪咕推出“元宇宙全民阅读”,为读者打造超沉浸、跨时空的阅读新体验。打破了物理时空界限、融合了看听读购、书友社交等元素于一体的比特书房也首次亮相。   “未来,作者和读者都能够借助人工智能参与到创作中来,创作与阅读相互交融,共创阅读新价值,让阅读无处不在。”咪咕数字传媒有限公司总经理于航说。   今天的书不只是静态的,也是动态的。侯晓楠认为,未来数字阅读可能是一座智能的图书馆,运用AIGC等先进技术,带给用户更生动的作品人物、更沉浸的互动体验。“在国家文化数字化战略下,数字阅读大有可为。伴随着产业新一轮提质升级,数字阅读应该进一步激活文化资源、发展数字化文化消费新场景,为全民阅读注入新动力。”   业内人士展望,新技术将持续赋能产业变革,为数字阅读领域提供更为广阔的发展空间。   中国音像与数字出版协会理事长孙寿山表示,数字阅读要不断丰富产品类型,持续探索服务模式,也要高度重视新一代信息技术的应用,确保科技赋能和科技向善。 责任编辑:王风 Keyword: 道教正