Apriori algorithm

Jung Hoon Kim
N5, Room 2239
E-mail: junghoon.kim@kaist.ac.kr

2014.01.07

KAIST Knowledge Service Engineering
Data Mining Lab.

1

Introduction
 Frequent pattern and association rule mining is one of

the few exceptions to emerge from machine learning
 Apriori algorithm

 AprioriTid algorithm
 AprioriAll algorithm
 FP-Tree algorithm

Data Mining Lab.

2

Notation


Data Mining Lab.

3

Principle
 downward closure property.
 If an itemset is frequenct,
then all of its subsets must
also be frequent
 if an itemset is not frequent,
any of its superset is never
frequent

Data Mining Lab.

4

Apriori algorithm
 Pseudo code

Data Mining Lab.

5

Example

Data Mining Lab.

6

Discussion
 Too many database scanning makes high computation

 Need minsup & minconf to be specified in advance.
 Use hash-tree to store the candidate itemsets.

Sometimes it adapt trie-structure to store sets.

Data Mining Lab.

7

AprioriTid


Data Mining Lab.

8

AprioriTid

Data Mining Lab.

9

AprioriTid

Data Mining Lab.

10

AprioriTid

Data Mining Lab.

11

FP-Growth
 To avoid scanning multiple database
 the cost of database is too high !!
 To avoid making lots of candidates
 in apriori algorithm, the bottleneck is generation of
candidate
 How can solve these problems?

Data Mining Lab.

12

FP-Growth
 Algorithm was too simple

1. Scan the database once, find frequent 1-itemsets

(single item patterns)
2. Sort the frequent items in frequency descending
order, f-list(F-list = f-c-a-b-m-p)
3. Scan the DB again, construct the FP-tree
Data Mining Lab.

13

FP-Growth Algorithm

Data Mining Lab.

14

FP-Tree
 Scanning the transaction with TID=100

Data Mining Lab.

15

FP-Tree
 Scanning the transaction with TID=200

Data Mining Lab.

16

FP-Tree
 Final FP-Tree

Data Mining Lab.

17

Mine a FP-Tree
forming conditional pattern bases
II. constructing conditional FP-trees
III. recursively mining conditional FP-trees
I.

Data Mining Lab.

18

Conditional pattern base
 frequent itemset as a co-occurring

suffix pattern
 for example
 m : <f, c, a> : support / 2
 m : <f,c,a,b> : support / 1

Data Mining Lab.

19

Conditional pattern tree
 {m}’s conditional pattern tree

Data Mining Lab.

20

Pseudo Code

Data Mining Lab.

21

Conclusion
 In data mining, association rules are useful for analyzing

and predicting customer behavior. They play an
important part in shopping basket data analysis, product
clustering, catalog design and store layout.

Data Mining Lab.

22

Thank you

Data Mining Lab.

23

Apriori algorithm

More Related Content

What's hot

Similar to Apriori algorithm

Recently uploaded

Apriori algorithm