定性分析工具ATLAS.ti的两种文本搜索方式

ATLAS.ti 是一款主流的定性分析工具,功能强大且一直在频繁更新,约三周前又新嵌入了GPT conversation功能。缺点致命:收费。挺贵。

本文主要讲ATLAS中明确被定义为"search"的两种关键词检索方式:Text Search 和 Regular Expression Search,即文本搜索和正则表达式搜索。

1. Text Search 文本搜索

1.1 界面

点开Text Search,打开文档选择界面,如下图。

最左侧是文档列表区,中间是文档分组列表区,最右侧是已经被选中的文档展示区。

可以在文档列表区逐一勾选需要检索的文档,也可以在分组列表区批量选择某分组中的所有文档。如图示例,选择分组"general"中的全部95个文件。

1.2 定义检索条件

文档选择完毕,进入Define Query界面。

对包含关键词的文本,ATLAS提供4种不同大小的展示区域:Paragraphs, Sentences, Words, Exact Matches,即,(包含着目标关键词的)段落、句子、单词、严格匹配的单词。建议选择Paragraphs或Sentences,方便后续在检索结果中直接进行标注,也即添加codes(后面有图)。

检索条件设置:

(1) 选择Paragraphs。略。

(2) 输入需检索的主关键词,例:data sanitization。

(3) [可选] 点击"Add",添加一个与主检索存在 "AND" 或 "OR" 关系的附加条件。如图,以"OR" 关系、动词 sanitize为例,填写在 OR 条件输入框中。

(4) ATLAS将自动查找 sanitize 的同义词,并依照 "同义词 [词性]" 对其进行分组。如图,共有29个同义词被列出在 Synonyms下拉框中。按需勾选。

(5) 在最下面条件框中检查、确认检索条件。

(6) Include inflected forms,意为:包含所有变形形式。

勾选该项,ATLAS将检索关键词、及其所有变形形式的单词。如下图说明文字:如果检索关键词 "run" ,那么将同时检索包含 "running"、"runs"、"... 和 "ran"的内容。

1.3 标注检索结果

如图,最终检索结果中包含了主关键词 data sanitization (图中3号),也包含关键词 sanitize (图中1号),及其变形形式santizing (图中2号),也包含了前面勾选过的 sanitize 的同义词 (图中没有截取到)。

注意每条检索结果的右侧:1号已被标注,2号和3号还没有被标注,处于 "No codings"状态。

选中需要被标注的条目,点击右上角"Apply Codes",在弹出的codes列表中找到"data sanitization",点开右侧按钮,即可完成批量标注。

2. Regular Expression Search 正则表达式搜索

正则表达式搜索的主要难点在于如何构造正则表达式,因此界面功能比文本搜索简单。

如图,以最简单的模糊匹配为例,输入 sanitiz*,不勾选 case-sensitive,直接 show results.

检索结果为48条,比文本搜索多检出了16条。如图,"sanitize-html", "sanitized" 等均为新增检出。

标注略。

End。


 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值