mysql用于检索的关键字,MySQL中的全文检索

最新推荐文章于 2024-04-10 21:24:46 发布

飛毛腿岡薩雷斯

最新推荐文章于 2024-04-10 21:24:46 发布

阅读量232

点赞数

文章标签： mysql用于检索的关键字

本文介绍了MySQL全文索引的工作原理，包括如何通过B-tree查找记录位置并计算相关度，以及在插入新记录时如何解析索引列并计算词频来确定词的权重。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

。产生的输出如310 0.7772509 word，这里的310是数据文件里包含word的记录的位置，0.7772509是用某种方式计算后得出的关联度(具体可参考storage/myisam/ft_nlq_search.c里的walk_and_match函数，storage/myisam/ft_defs.h里的宏GWS_IN_USE，GWS_PROB, GWS_IDF等)，第三个是词条。

构建好的全文索引里并不存储实际的数据，所以不能用于covering index。

全文索引不会用于排序操作(order by)，但自然语言检索中的相关性(relevance)可用于排序。如：

SELECT id, body, MATCH (title,body) AGAINST ('Security implications of running MySQL as root') AS score FROM articles WHERE MATCH (title,body) AGAINS ('Security implications of running MySQL as root');

二、关键字的选取

并不会对索引列里的每个词都建立索引，筛选过程包括去除停用词，去除长度少于ft_min_word_len和大于ft_max_word_len。

三、全文检索实现

首先在全文索引里进行B-tree查找，找到适合的记录的位置，根据存储在树中的每个单独的词的关联度计算出记录的相关度，并根据相关度排序。

四、全文插入实现

当插入一条新的记录时，首先parse记录里的索引列(源文件可参考storage/myisam/ft_parse.c)，把它们分成单独的词，忽略停用词(源文件参考ft_stopwords.c、ft_static.c)和长度不符的词。计算出词频，从而计算出词的权重。然后把记录的位置、词的权重、词插入全文索引(源文件参考ft_update.c)。

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。