mysql用于检索的关键字,MySQL中的全文检索

本文介绍了MySQL全文索引的工作原理,包括如何通过B-tree查找记录位置并计算相关度,以及在插入新记录时如何解析索引列并计算词频来确定词的权重。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

。产生的输出如310  0.7772509   word,这里的310是数据文件里包含word的记录的位置,0.7772509是用某种方式计算后得出的关联度(具体可参考storage/myisam/ft_nlq_search.c里的walk_and_match函数,storage/myisam/ft_defs.h里的宏GWS_IN_USE,GWS_PROB, GWS_IDF等),第三个是词条。

构建好的全文索引里并不存储实际的数据,所以不能用于covering index。

全文索引不会用于排序操作(order by),但自然语言检索中的相关性(relevance)可用于排序。如:

SELECT id, body, MATCH (title,body) AGAINST ('Security implications of running MySQL as root') AS score FROM articles WHERE MATCH (title,body) AGAINS ('Security implications of running MySQL as root');

二、关键字的选取

并不会对索引列里的每个词都建立索引,筛选过程包括去除停用词,去除长度少于ft_min_word_len和大于ft_max_word_len。

三、全文检索实现

首先在全文索引里进行B-tree查找,找到适合的记录的位置,根据存储在树中的每个单独的词的关联度计算出记录的相关度,并根据相关度排序。

四、全文插入实现

当插入一条新的记录时,首先parse记录里的索引列(源文件可参考storage/myisam/ft_parse.c),把它们分成单独的词,忽略停用词(源文件参考ft_stopwords.c、ft_static.c)和长度不符的词。计算出词频,从而计算出词的权重。然后把记录的位置、词的权重、词插入全文索引(源文件参考ft_update.c)。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值