
Jina 技术分享实录
文章平均质量分 86
Jina AI
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
搜索准确性提升 20%,Jina Reranker 成为 RAG 优化的新标杆!
日前,我们正式发布了 Jina Reranker(jina-reranker-v1-base-en),专为提高搜索准确性打造。Jina Reranker 在多个权威测评中屡获领先,实验数据显示,相比简单 RAG 系统,搭载该模型的检索系统命中率提高 8%,MRR 更是飙升 33%。原创 2024-03-05 19:55:51 · 2005 阅读 · 0 评论 -
RAG 领域的新宠:为什么 AI 圈都在谈论 Jina ColBERT?
向量模型新选择!原创 2024-02-27 03:52:02 · 1950 阅读 · 0 评论 -
Jina AI全新Inference服务,LangChain开发体验从未如此丝滑
由于 Token 的限制,在开发 LangChain 问答机器人应用时,我们经常需要将文档切割,接着使用分别将分割后的 Document 变成 Embeddings,即向量表示。同时输入的问题,也需要用到变成向量,再根据向量相似度找到最相近的 Embedding,将它们拼接成答案返回。由此可见,一个合适又好用的 Embedding 引擎在 LangChain 应用开发过程中的重要性。Inference 就是由 Jina AI 推出的,旨在为企业和开发者提供。原创 2023-05-18 18:43:08 · 1156 阅读 · 1 评论 -
DocArray 和 Redis 联手,让推荐系统飞起来
在DocArray中使用Redis后端,基于向量相似性搜索可以快速搭建一个实时商品推荐系统。现在,跟上我们的脚步,一起了解搭建系统的关键步骤,并且深入了解推荐的原理吧!推荐系统会根据用户画像、历史行为(如购买、喜欢、浏览等),给用户的兴趣建模,主动提供个性化推荐。它可以提升转化率并保持用户忠诚度,因而被广泛应用在各类电子商务网站。原创 2022-12-13 17:22:04 · 980 阅读 · 0 评论 -
搜索是过拟合的生成;生成是欠拟合的搜索
神经搜索的最大竞争者可能来自于一种甚至不需要向量嵌入作为中间表示的技术 —— 一种直接返回你想要的结果的端到端技术。"那么,谁将是神经搜索最大的竞争对手?"原创 2022-12-13 16:45:19 · 420 阅读 · 0 评论 -
Jina AI创始人肖涵博士解读多模态AI的范式变革
本文由 Jina AI 创始人肖涵为大家带来多模态 AI 技术的行业洞察分享。原创 2022-12-05 17:46:56 · 697 阅读 · 0 评论 -
CLIP-as-service 0.8.0 版本发布:新增支持大型 ONNX 模型文件
CLIP-as-service 是一种用于编码图像和文本的低延迟、高可扩展性服务。它可以作为微服务轻松集成到神经搜索解决方案中。原创 2022-10-25 09:12:47 · 1121 阅读 · 0 评论 -
1024 分享|如何打造围绕开源理念的团队工程师文化
10月 23 号,在 CCF CED 2022 大会上,Jina AI 联合创始人兼 CTO 王楠博士代表 Jina AI 团队分享了《从神经搜索到多模态应用:和全球团队一起打造优秀的开源工具》,与全国线上线下的工程师们交流“工程师文化”。原创 2022-10-25 08:43:53 · 316 阅读 · 0 评论 -
程序员脱口秀|10.20 硬核女孩召集!
10 月 20 号硬核女孩召集!了解开源社区里的女性力量和她们的 Coding 日常!打泰拳的 AI 技术架构师博士,带着电脑游走 120+ 国家的产品经理,德国仪表公司的架构工程师,开源社区高级运营工程师...嘉宾们都有“打破刻板印象”的绝对能力!所在行业也属于前沿阵地,让我们和那些硬核的女性科技从业者们一起玩耍起来!20 号晚 8 点一起来了解她们的硬核成长故事。原创 2022-10-18 12:56:18 · 474 阅读 · 0 评论 -
中关村归国留学人员联创中心揭牌仪式,Jina AI 受邀出席活动
2022 年 9 月 25 日上午,中关村归国留学人员联创中心揭牌仪式在中关村创业大街顺利举行,Jina AI 联合创始人兼 COO 何烜彬现场进行企业项目分享,并面向现场各海外高校校友代表发出人才招募邀请。原创 2022-09-26 22:01:28 · 447 阅读 · 0 评论 -
一文读懂Jina生态的Dataclass
Jina 现支持的 Dataclass 新特性提供了更丰富的默认方法支持,大大简化了定义类对象的代码量,代码简洁明晰。本文我将向你介绍 Dataclass 所带来的便利性,为什么要使用它,以及演示如何使用它。原创 2022-09-21 23:14:08 · 1200 阅读 · 0 评论 -
J-Tech & 开源之夏|什么是比快更快的向量搜索
本期 J-Tech Talk 邀请到了在开源之夏项目中脱颖而出的杨小燕,分享她负责的项目《支持 Redis 数据库作为 DocArray 的存储后台》帮助更多的开发者高效地进行向量检索。原创 2022-09-19 23:02:07 · 486 阅读 · 0 评论 -
如何用DockArray的子索引实现嵌套数据的搜索
在数据很简单的时候,每个向量都代表一个数据点,我们轻松地存储到任意向量数据库,基于相似度去检索 embedding。但现实世界的数据总是很混乱的,多模态数据有着各式各样的层次嵌套结构。原创 2022-08-31 14:50:29 · 151 阅读 · 0 评论 -
活动回顾|8月中文社区面对面
8 月 18 号 Jina AI 举办了「中文社区面对面」活动,本文为分享回顾。1. CLIP-as-service 比 CLIP 多了哪些更好用的功能?2. Finetuner 的介绍和示例3. 社区明星项目的开发体验和心得原创 2022-08-22 22:34:59 · 298 阅读 · 0 评论 -
Jina 实例秀|基于神经搜索的网络安全威胁检测(一)
正好机缘巧合下,我了解到了 Jina,我想试试看能否通过将编码特征索引到 DocumentArray,根据它在向量空间中的最近邻的类别,将网络流量分类为良性/恶意,来获得更好的结果。这就是所谓的迁移学习,我们使用预训练的神经网络作为起点,找到已有知识和新知识之间的相似性,从最初未训练的数据中学习模式。通过比较每个 Document 的 embedding 和索引中的每个embedding,取距离最近,相似度最高的那一个,并根据其最近邻的“known_label”将其分类为良性或恶意。...原创 2022-08-04 01:39:49 · 218 阅读 · 0 评论 -
分享回顾 | 基于深度学习的神经语义搜索
本文内容主要分为以下四部分:神经搜索的背景及优势一、什么是神经搜索?神经搜索 (Neural Search) 由 Jina AI 首创,可以理解为 Deep Learning for Search 的简称,是指借助深度学习技术,使用非结构化数据,搜索非结构数据。神经搜索包括两个重要部分:信息搜索及深度学习技术。1、神经搜索之信息搜索提到搜索,最直观的理解就是 Google、百度、Amazon 网站首页上的搜索框,用户在搜索框里输入关键词,搜索系统给用户返回和关键词匹配的相关内原创 2022-04-07 20:38:21 · 2397 阅读 · 0 评论 -
DocArray x Weaviate | 打造高效的云端数据存储
Weaviate 作为 DocArray 中的 Document Store,可以使得 Document 在云端的处理和检索更加迅速。DocArray & Weaviate 大起底DocArray: Data structure for unstructured dataDocArray 是一种可扩展数据结构,完美适配深度学习任务,主要用于嵌套及非结构化数据的传输, 支持的数据类型包括文本、图像、音频、视频、3D mesh 等。与其他数据结构相比:✅ 表示完全支持,✔ 表示部分支持,.原创 2022-03-29 12:19:20 · 966 阅读 · 0 评论 -
说了那么多,到底什么是「神经搜索」?
什么是神经搜索?它与普通搜索有什么区别?它能解决哪些问题?又有哪些优势和劣势?原创 2022-03-18 15:00:14 · 4781 阅读 · 2 评论 -
救救小王吧:如何快速解决图像相似性检测问题?
相似性图像检测,是模型训练过程中常出现的问题,本文介绍了 4 个常用的哈希算法,并通过 Colab 代码,展示了完整的训练过程。新晋炼丹师小王最近遇到了一个难题,愁的头发掉了好几根儿。一问...原创 2022-03-11 15:16:22 · 2244 阅读 · 0 评论 -
Jina AI 两周年 | 步履不停,尽情施展
文章导读 2 月是 Jina AI 的生日月,全球各地 Office用妙趣横生的在线游戏,以及美味的食物、欢快的合照,共同为 Jina AI 庆生~2020 年 2 月,新冠病毒开始肆虐...原创 2022-02-21 17:54:00 · 604 阅读 · 0 评论 -
Jina AI x 极客公园 | 柏林 Office 惊喜扫楼,明晚直播不见不散~
Jina AI 与国内创新者大本营极客公园首次合作,创始人兼 CEO 肖涵博士将做客创业真人秀视频号直播间。Jina AI:让「搜索自由」成为现实搜索技术是所有数据智能的基础,无论结构化数据还是非结构化数据,只有实现了搜索,才有能力做更高级的数据智能和更上层的智能应用。编辑切换为居中常见的非结构化数据包括 PDF 文档、视频、音乐等注:据 MongoDB 统计,我们身边 80%~90% 的数据,都属于非结构化数据。掌握先进搜索技术的大型企业,数据规模巨大,往往会自行搭建企业内部的搜索系.原创 2022-02-23 21:02:35 · 214 阅读 · 0 评论 -
论文分享 | Yann LeCun 联合发布、工程师都在读的自监督学习论文
本期文章中,我们为大家带来了 3 篇自监督学习的相关论文,其中两篇是由卷积网络之父 Yann LeCun 参与发布。原创 2022-02-18 11:57:36 · 2041 阅读 · 0 评论 -
一文读懂神经搜索、Jina 及 Finetuner
内附 Demo 及 PPT原创 2022-01-12 17:12:04 · 1958 阅读 · 0 评论