SlideShare a Scribd company logo
자연지리학 개론
4주차 3/20 자연지리실험실 방문
국토문제연구소 전청옥
#벚꽃스타그램
인스타그램 태그로 살펴본 벚꽃 개화시기 추정
스리랑카 2019
인도별거북 서식처 답사
연구 관심사: 공간통계, 종 분포 모형, 기계 학습
LophitaL@snu.ac.kr
국토문제연구소 전청옥
학습 목표
 종 분포 모형의 원리와 목적을 이해한다
 종 분포 모형 결과를 해석하고 올바르게 추론할 수 있다
 종 분포 모형의 적합 과정에 대해서 이해한다
들어가기 전에
 “선호”에 대한 예측과 해석 방법
 자연지리학 뿐만 아니라 연구, 산업, 행정 등에서
이미 폭 넓게 사용되는 도구(추천 시스템, 입지 분석, 수요 예측 등)
 관심 분야가 아니더라도 알아 두면 좋은 내용
들어가기 전에
 기계학습 기반 추론이 어떻게 작동하는지
 기계학습과 사람이 각각 잘할 수 있는 일은 무엇인지
 기계학습 기반 추론을 어떻게 실생활에 응용할 수 있는지
 자연지리학의 모델링 연구는 첨단 컴퓨터 과학과 연계되어 있는 분야
AI 자연지리학
당신이 인도네시아 공무원이라면……
제한된 예산
제한된 인력
제한된 시간
보전 구역 설정 지시
최대한 많은
오랑우탄 보호
1. 오랑우탄이 많은 곳
2. 오랑우탄이 서식하기 좋은 곳
3. 서식처 훼손 위협이 심각한곳
4. 기존 보전 구역과 가까운 곳
Where?
수혜받는 오랑우탄이 많은 곳으로
오랑우탄이 좋아하는 곳으로
가장 도움이 필요한 곳으로
가장 경제적인 곳으로
당신이 인도네시아 공무원이라면……
제한된 예산
제한된 인력
제한된 시간
보전 구역 설정 지시
최대한 많은
오랑우탄 보호
1
3
5
4
2
어디에 많이 있으니까. 만으로는 부족한 타당성
양질의 서식처 파악
오랑우탄이 좋아하는 곳 중에서
지역별 특성 파악
1
3
5
4
2
가장 보전이 필요한 곳을 찾기
합리적인 보전 대책
종 분포 모형
한국의 공무원들도 비슷한……
반달가슴곰 보존 사업 실시
최적의 서식처는?
최적의 사업대상지는?
히말라야 눈표범
국제적 멸종위기종
Trophy hunting
지역 목축민들과의 갈등
좁은 계곡에 서식
낮은 유전자 풀
히말라야 눈표범의
서식처 보전 대책 =
양질의 서식처 +
서식처 간의 연결성
주요 서식처
서식처 보호
우선 대상지
종 분포 모형의 해석
3400m~4300m 고도이면
눈표범이 출현할 확률이
50%이상이기 때문에
눈표범은 3400~4300m 고도를 선호한다
종 분포 모형
뭘 좋아하고 싫어하는지 맞춰볼게
대나무를 좋아하는 판다는
대나무 근처에 있을 거야
종의 환경 선호도에 기반한 공간 분포 추정
종 분포 모형
종이 자주 발생한 곳의 특징에
기반한 공간 분포 추정
산사태 분포 모형
산사태가 자주 발생하는 곳의 특징에
기반한 공간 분포 추정
범죄 분포 모형
범죄가 자주 발생하는 곳의 특징에
기반한 공간 분포 추정
서비스업 분포 모형
서비스업이 자주 발생하는 곳의 특징에
기반한 공간 분포 추정
…
…
분포 모형 관심 대상의 공간 분포를 예측, 설명
Alexander von Humboldt
1769년 9월 14일~1859년 5월 6일
자연지리학의 거인
생물의 수직적 분포에 대한 관심
Naturgemälde(나투어게멜데)
고도마다 달라지는 환경과 식생을 연결지어 기술
열대림
온대림
냉대림
온도, 강수량이 바뀌면
서식하는 종이 바뀐다!
종 분포 모형(Species distribution model) 생태학적 지위 모형(Ecological niche model)
환경이 달라지면, 서식하는 생물도 달라진다
서식하는 생물이 다르면, 환경도 다르다!
종 분포 모형
• 종이 분포하는 지리적 위치와
환경 변수간 상관(Correlation)관계
포착해 생물 종의 분포를 통계적으로 제시하는 모형
선호에 대하여…
종 분포 모형 실습 서울대학교
종 분포 모형 = 종의 환경 선호도 조사
1. 좋아하는 것과 싫어하는 것
2. 주어진 것 중, 선택하는 것
1. 좋아하는 것과 싫어하는 것
출현하는 곳과 안출현하는 곳의 특징을 비교
감귤류는 따뜻한 곳을 좋아하고, 추운 곳은 싫어한다
1. 좋아하는 것과 싫어하는 것
하지만 호불호가 그때 그때 바뀐다면?
= 호불호가 명확한 타입
선택지에 따라 선호도가 바뀌는 타입도 있다
2. 주어진 것 중, 선택하는 것
선택지를 주고 선택한 곳의 특징을 파악
엄청 좋아하는 건 아니지만, 이 중에선 이걸 고를게
쓰레기를 좋아하진 않지만 주변에 먹을게 마땅치않다면… 다른 동물에 붙어있는 걸 좋아하지만 양식장이 있다면
2. 주어진 것 중, 선택하는 것
1. 좋아하는 것과 싫어하는 것
출현 자료와 비출현 자료:
선호하는 환경과 싫어하는 환경을 지시하는 정보
출현 자료와 배경자료:
선호하는 환경과 주어진 환경을 지시하는 정보
풀: 20%
모래: 70%
강: 10%
오리 분포 모형의 예시
풀 모래 강
오리 서식처는
주변의 풀, 모래, 강의 비율에 따라 결정된다.
출현 자료:
좋아하는 환경
비출현 자료:
싫어하는 환경
배경자료:
주어진 환경
주변의 범위
풀: 2
모래: 7
강: 1
출현 자료와 비출현 자료:
선호하는 환경과 싫어하는 환경을 지시하는 정보
풀: 10
모래: 0
강: 0
풀: 0
모래: 1
강: 9
풀: 2
모래: 7
강: 1
오리는 풀이 많은 곳에서 많이 있다.
오리는 강이 많은 곳에서 없었다
풀: 10
모래: 0
강: 0
풀: 0
모래: 1
강: 9
오리는 풀이 많은 곳을 좋아하고
강이 많은 곳을 싫어하니
오리 서식처는 풀이 많고 강이 적은 곳이다.
풀: 2
모래: 7
강: 1
풀: 10
모래: 0
강: 0
풀: 0
모래: 1
강: 9
출현 자료와 배경자료:
선호하는 환경과 주어진 환경을 지시하는 정보
풀: 2
모래: 7
강: 1
풀: 10
모래: 0
강: 0
풀: 0
모래: 1
강: 9
강이 많은 곳, 모래가 많은 곳, 풀이 많은 곳 중에서
오리는 풀이 많은 곳에서 많이 있다.
오리에게 풀 많은 곳, 모래 많은 곳,
강이 많은 곳을 다 보여주었으나
풀이 많은 곳을 주로 선택했으니
오리 서식처는 풀이 많고 강이 적은 곳이다.
종 분포 모형?
모형? 모델? 모델링?
𝑦𝑦 = 𝑎𝑎𝑥𝑥 + 𝑏𝑏
심박수
산소포화도
칼로리 소모
운동 횟수
내가 가진 정보
알고자 하는 정보
빛의 반사량
흡수량의 변화
정확하진 않지만, 추정은 할 수 있어
종 분포 모형 실습 서울대학교
2. 주어진 것 중, 선택하는 것
1. 좋아하는 것과 싫어하는 것
출현 자료와 비출현 자료:
선호하는 환경과 싫어하는 환경을 지시하는 정보
출현 자료와 배경자료:
선호하는 환경과 주어진 환경을 지시하는 정보
𝑦𝑦 = 𝑎𝑎𝑥𝑥 + 𝑏𝑏
내가 가진 정보
알고자 하는 정보
서식처 적합도
출현 확률
출현 자료
비출현 자료
배경 자료
환경 변수
𝑦𝑦 = 𝑎𝑎𝑥𝑥 + 𝑏𝑏
환경 변수, 출현, 비출현,
배경 자료
서식처 적합도
통계 모형
Boosted Regression Tree Artificial Neural Network Maximum Entropy
선형 회귀, 기계학습, 딥러닝
학습 목표
 종 분포 모형의 원리와 목적을 이해한다
 종 분포 모형 결과를 해석하고 올바르게 추론할 수 있다
 종 분포 모형의 적합 과정에 대해서 이해한다
실습 목표
• 자신이 관심있는 종을 선정하고
종 분포 모형 분석을 실시합니다.
• 분석 결과를 토대로
팀 별로
최소 2페이지 분량의
분석 보고서를 작성합니다.
R package
Wallace
 생물지리학자 Alfred Russel Wallace의 이름을
따 만든 종 분포 모형 분석 툴
 복잡한 R 코드 없이 마우스 클릭만으로 종 분포
모형을 만들고 예측, 해석할 수 있음
Kass, J.M., et. al. (2022). wallace 2: a shiny app for modeling
species niches and distributions redesigned to facilitate
expansion via module contributions. Ecography, e06547.
install.packages("wallace")
wallace::run_wallace()
Maximum Entropy algorithm
 2004년 국제 기계학습 컨퍼런스에서 Steven J. Philips, Miroslav Dudík에 의해 처음 제시
 출현 자료와 배경 자료를 사용하는 종 분포 모형 알고리즘
 최대 엔트로피 이론에 기반
 높은 예측 성능과 다양한 하이퍼 파라미터 조절 기능
 2023년 기준 10,033회 인용(web of science 기준, Ecological modelling, 2006)
Maximum Entropy algorithm
 기계학습 전문가로써 AT&T 연구소에서 근무하던 중,
자신의 뉴욕 아파트 근처 미국 자연사 박물관을 방문
 미국 자연사 박물관의 생물다양성 센터(CBC)의 센터장과 우연히 마주침
 그들의 생물 다양성 보전을 위한 노력에 감명받아
컴퓨터 과학자로써 도울 수 있는 일에 대해서 이야기하고 아이디어를 얻음
 2016년 AT&T에서 알고리즘의 코드 공개를 승인
 JAVA(Maxent GUI)와 R(maxnet) 방식으로 사용 가능
종 분포 모형 실습 서울대학교
출현자료 환경변수
출현 자료
선택
배경 자료
선택 환경 분석
출현 자료
분할 모델링 시각화
모형 전이
(예측) 결과 기록
분석의 순서
복잡한 설명은 생략합니다.
핑크색 박스를 눌러서 따라오세요.
현종하는 종의 데이터베이스 중에서
GBIF 데이터 베이스에서
종 학명 입력(e.g. Homo sapiens)
찾을 데이터의 최소 개수 입력
반드시 대문자!
스페이스 없도록
검색 실시
WorldClim Bioclims
데이터베이스에서
환경 변수로 이동
마지막으로 로드
10 arcmin 해상도
선택(가장 조잡한 해상도)
옵션 선택
선택
지도에서 출현 자료 선택
출현 자료 결정
다각형 선택
폴리곤 그리고 Finish 설정
선택
배경 자료 범위 선정 방법 선택
최외곽 점들을 잇는 폴리곤에서 배경 자료 수집
선택
배경자료의 수:10,000 입력
선택
폴리곤을 보다 크게:3 입력
선택
비공간 출현 자료 구분 선택
교차검증 방법:Random k-fold 선택
K의 개수:5 입력
실행
선택
Maxent:
최대 엔트로피 모형 선택
Maxnet 사용
하이퍼파라미터1 -피처클래스:
LQH 피처만 사용
하이퍼파라미터2 –규제 파라미터:
1 규제 파라미터만 사용
FALSE 사용
FALSE 사용
실행
분석 보고서 제출 – 3월 27일 월요일까지
• 자신이 관심있는 종을 선정하고 종 분포 모형 분석을 실시합니다.
• 분석 결과를 토대로 최소 2페이지 분량의 분석 보고서를 팀 별로 작성합니다.
• 오늘 다룬 내용 말고도 wallace 패키지에 있는 여러 다른 기능들을 사용해보세요.
• 모형의 결과가 항상 정답은 아닙니다. 왜 이런 결과가 나왔는지 고민해보세요.
• 모형 해석과 예측에 주의해야할 사항을 “근거를 들어” 서술해보세요.
• 모형 분석을 함으로써 얻을 수 있는 이점을 고민해보세요.
• 모형 분석의 단점은 무엇인지 고민해보세요.
• 앞으로 모형을 개선시킨다면 어떻게 할 수 있는지 고민해보세요.
• 모형 적합 단계 중 많은 선택들이 있었습니다.
여러 선택 옵션을 조사하고 해당 옵션이 모형 결과에 미치는 영향을 서술해보세요.
Not necessary to answer all
But recommended to
include in the report
왼쪽의 내용을 보고서에
모두 담지 않아도 됩니다.
패키지를 다양하게 사용해보고
그 결과를 논리적으로 쓰면 됩니다.
• 사용하는 변수가 기후 변수 밖에 없으므로 기후에 민감한 종을 선택하세요.
• 최소한 100건의 출현 자료가 있는 종을 선택하세요.
• Env Space 분석을 실시하려면 여러 종을 선택해야 합니다.
• 질문이 있다면 LophitaL@snu.ac.kr 로
자세한 맥락과 에러 내용을 보내주세요.
분석 보고서 제출 – 3월 27일 월요일까지

More Related Content

PDF
[공간정보시스템 개론] L03 지구의형상과좌표체계
Kwang Woo NAM
 
PDF
종 분포 모형 활용방안
Sanghyuk Lee
 
PDF
R 프로그래밍을 이용한 야생동물 행동권(HR) 분석
Byeong-Hyeok Yu
 
PDF
지리정보체계(GIS) - [2] 좌표계 이해하기
Byeong-Hyeok Yu
 
PDF
오픈드론맵 한국어 사용자 지침서
Byeong-Hyeok Yu
 
PDF
지리정보체계(GIS) - [1] GIS 데이터 유형, 구조 알기
Byeong-Hyeok Yu
 
PDF
QGIS를 활용한 공간분석 입문(1일 6시간)
Byeong-Hyeok Yu
 
PDF
QGIS 실습 (총 7차시)
Byeong-Hyeok Yu
 
[공간정보시스템 개론] L03 지구의형상과좌표체계
Kwang Woo NAM
 
종 분포 모형 활용방안
Sanghyuk Lee
 
R 프로그래밍을 이용한 야생동물 행동권(HR) 분석
Byeong-Hyeok Yu
 
지리정보체계(GIS) - [2] 좌표계 이해하기
Byeong-Hyeok Yu
 
오픈드론맵 한국어 사용자 지침서
Byeong-Hyeok Yu
 
지리정보체계(GIS) - [1] GIS 데이터 유형, 구조 알기
Byeong-Hyeok Yu
 
QGIS를 활용한 공간분석 입문(1일 6시간)
Byeong-Hyeok Yu
 
QGIS 실습 (총 7차시)
Byeong-Hyeok Yu
 

What's hot (20)

PDF
DeepPose: Human Pose Estimation via Deep Neural Networks
Shunta Saito
 
PDF
R project_pt1
Joonho Lee
 
PDF
파이콘 한국 2019 튜토리얼 - SHAP (Part 3)
XAIC
 
PPTX
[IGC 2016] 넷게임즈 김영희 - Unreal4를 사용해 모바일 프로젝트 제작하기
강 민우
 
PPTX
SLAM-베이즈필터와 칼만필터
jdo
 
PDF
Unite2019 HLOD를 활용한 대규모 씬 제작 방법
장규 서
 
PDF
강화학습 기초부터 DQN까지 (Reinforcement Learning from Basics to DQN)
Curt Park
 
PDF
선박식별정보를 이용한 어업활동 공간밀도 가시화
r-kor
 
PDF
Graph Neural Network in practice
tuxette
 
PDF
PyconJP2017 Kivyによるアプリケーション開発のすすめ
Jun Okazaki
 
PPTX
多変量解析
Yoshihiro_Handa
 
PDF
言語モデル入門 (第二版)
Yoshinari Fujinuma
 
PDF
Single Shot Multibox Detector
NamHyuk Ahn
 
PDF
QGIS를 활용한 공간분석 입문 ver.1.0
Byeong-Hyeok Yu
 
PDF
遺伝的アルゴリズム (Genetic Algorithm)を始めよう!
Kazuhide Okamura
 
PPTX
Recent Progress on Object Detection_20170331
Jihong Kang
 
PPTX
OpenCV 에서 OpenCL 살짝 써보기
Seunghwa Song
 
PPTX
Proj4를 이용한 좌표계 변환
BJ Jang
 
PDF
IROS2020 survey
robotpaperchallenge
 
PDF
R-CNNの原理とここ数年の流れ
Kazuki Motohashi
 
DeepPose: Human Pose Estimation via Deep Neural Networks
Shunta Saito
 
R project_pt1
Joonho Lee
 
파이콘 한국 2019 튜토리얼 - SHAP (Part 3)
XAIC
 
[IGC 2016] 넷게임즈 김영희 - Unreal4를 사용해 모바일 프로젝트 제작하기
강 민우
 
SLAM-베이즈필터와 칼만필터
jdo
 
Unite2019 HLOD를 활용한 대규모 씬 제작 방법
장규 서
 
강화학습 기초부터 DQN까지 (Reinforcement Learning from Basics to DQN)
Curt Park
 
선박식별정보를 이용한 어업활동 공간밀도 가시화
r-kor
 
Graph Neural Network in practice
tuxette
 
PyconJP2017 Kivyによるアプリケーション開発のすすめ
Jun Okazaki
 
多変量解析
Yoshihiro_Handa
 
言語モデル入門 (第二版)
Yoshinari Fujinuma
 
Single Shot Multibox Detector
NamHyuk Ahn
 
QGIS를 활용한 공간분석 입문 ver.1.0
Byeong-Hyeok Yu
 
遺伝的アルゴリズム (Genetic Algorithm)を始めよう!
Kazuhide Okamura
 
Recent Progress on Object Detection_20170331
Jihong Kang
 
OpenCV 에서 OpenCL 살짝 써보기
Seunghwa Song
 
Proj4를 이용한 좌표계 변환
BJ Jang
 
IROS2020 survey
robotpaperchallenge
 
R-CNNの原理とここ数年の流れ
Kazuki Motohashi
 
Ad

Similar to 종 분포 모형 실습 서울대학교 (12)

PPTX
농업 빅데이터를 활용한 병해충 발생 예측 모형
datasciencekorea
 
PPTX
데이터분석의 길 3 “r 워크플로우 (스토리텔링)”
Jaimie Kwon (권재명)
 
PDF
RUCK 2017 빅데이터 분석에서 모형의 역할
r-kor
 
PDF
RUCK 2017 베이즈 모형의 꽃 - 계층 모형
r-kor
 
PDF
도시생태계의 이해(2)
여성환경연대
 
PPT
인공지능발표-근태.ppt 유전자 알고리즘을 이용한 영상 특징 추출 경북대학교 박근태
Daniel Shin
 
PDF
Big data 시대의 통계학
Jae-kwang Kim
 
PDF
Decision tree
Jeonghun Yoon
 
PPTX
웹보메트릭스06 1
Inho Cho
 
PPTX
웹보메트릭스와 계량정보학06 1
Han Woo PARK
 
PDF
AquaGlobe project
JungeunKim49
 
PPTX
10장 진화학습
Minchul Jung
 
농업 빅데이터를 활용한 병해충 발생 예측 모형
datasciencekorea
 
데이터분석의 길 3 “r 워크플로우 (스토리텔링)”
Jaimie Kwon (권재명)
 
RUCK 2017 빅데이터 분석에서 모형의 역할
r-kor
 
RUCK 2017 베이즈 모형의 꽃 - 계층 모형
r-kor
 
도시생태계의 이해(2)
여성환경연대
 
인공지능발표-근태.ppt 유전자 알고리즘을 이용한 영상 특징 추출 경북대학교 박근태
Daniel Shin
 
Big data 시대의 통계학
Jae-kwang Kim
 
Decision tree
Jeonghun Yoon
 
웹보메트릭스06 1
Inho Cho
 
웹보메트릭스와 계량정보학06 1
Han Woo PARK
 
AquaGlobe project
JungeunKim49
 
10장 진화학습
Minchul Jung
 
Ad

종 분포 모형 실습 서울대학교

  • 1. 자연지리학 개론 4주차 3/20 자연지리실험실 방문 국토문제연구소 전청옥
  • 2. #벚꽃스타그램 인스타그램 태그로 살펴본 벚꽃 개화시기 추정 스리랑카 2019 인도별거북 서식처 답사 연구 관심사: 공간통계, 종 분포 모형, 기계 학습 [email protected] 국토문제연구소 전청옥
  • 3. 학습 목표  종 분포 모형의 원리와 목적을 이해한다  종 분포 모형 결과를 해석하고 올바르게 추론할 수 있다  종 분포 모형의 적합 과정에 대해서 이해한다
  • 4. 들어가기 전에  “선호”에 대한 예측과 해석 방법  자연지리학 뿐만 아니라 연구, 산업, 행정 등에서 이미 폭 넓게 사용되는 도구(추천 시스템, 입지 분석, 수요 예측 등)  관심 분야가 아니더라도 알아 두면 좋은 내용
  • 5. 들어가기 전에  기계학습 기반 추론이 어떻게 작동하는지  기계학습과 사람이 각각 잘할 수 있는 일은 무엇인지  기계학습 기반 추론을 어떻게 실생활에 응용할 수 있는지  자연지리학의 모델링 연구는 첨단 컴퓨터 과학과 연계되어 있는 분야 AI 자연지리학
  • 6. 당신이 인도네시아 공무원이라면…… 제한된 예산 제한된 인력 제한된 시간 보전 구역 설정 지시 최대한 많은 오랑우탄 보호 1. 오랑우탄이 많은 곳 2. 오랑우탄이 서식하기 좋은 곳 3. 서식처 훼손 위협이 심각한곳 4. 기존 보전 구역과 가까운 곳 Where? 수혜받는 오랑우탄이 많은 곳으로 오랑우탄이 좋아하는 곳으로 가장 도움이 필요한 곳으로 가장 경제적인 곳으로
  • 7. 당신이 인도네시아 공무원이라면…… 제한된 예산 제한된 인력 제한된 시간 보전 구역 설정 지시 최대한 많은 오랑우탄 보호 1 3 5 4 2 어디에 많이 있으니까. 만으로는 부족한 타당성
  • 8. 양질의 서식처 파악 오랑우탄이 좋아하는 곳 중에서 지역별 특성 파악 1 3 5 4 2 가장 보전이 필요한 곳을 찾기 합리적인 보전 대책 종 분포 모형
  • 9. 한국의 공무원들도 비슷한…… 반달가슴곰 보존 사업 실시 최적의 서식처는? 최적의 사업대상지는?
  • 10. 히말라야 눈표범 국제적 멸종위기종 Trophy hunting 지역 목축민들과의 갈등
  • 12. 히말라야 눈표범의 서식처 보전 대책 = 양질의 서식처 + 서식처 간의 연결성 주요 서식처 서식처 보호 우선 대상지
  • 13. 종 분포 모형의 해석 3400m~4300m 고도이면 눈표범이 출현할 확률이 50%이상이기 때문에 눈표범은 3400~4300m 고도를 선호한다
  • 14. 종 분포 모형 뭘 좋아하고 싫어하는지 맞춰볼게 대나무를 좋아하는 판다는 대나무 근처에 있을 거야 종의 환경 선호도에 기반한 공간 분포 추정
  • 15. 종 분포 모형 종이 자주 발생한 곳의 특징에 기반한 공간 분포 추정 산사태 분포 모형 산사태가 자주 발생하는 곳의 특징에 기반한 공간 분포 추정 범죄 분포 모형 범죄가 자주 발생하는 곳의 특징에 기반한 공간 분포 추정 서비스업 분포 모형 서비스업이 자주 발생하는 곳의 특징에 기반한 공간 분포 추정 … … 분포 모형 관심 대상의 공간 분포를 예측, 설명
  • 16. Alexander von Humboldt 1769년 9월 14일~1859년 5월 6일 자연지리학의 거인 생물의 수직적 분포에 대한 관심
  • 17. Naturgemälde(나투어게멜데) 고도마다 달라지는 환경과 식생을 연결지어 기술 열대림 온대림 냉대림 온도, 강수량이 바뀌면 서식하는 종이 바뀐다!
  • 18. 종 분포 모형(Species distribution model) 생태학적 지위 모형(Ecological niche model) 환경이 달라지면, 서식하는 생물도 달라진다 서식하는 생물이 다르면, 환경도 다르다!
  • 19. 종 분포 모형 • 종이 분포하는 지리적 위치와 환경 변수간 상관(Correlation)관계 포착해 생물 종의 분포를 통계적으로 제시하는 모형
  • 22. 종 분포 모형 = 종의 환경 선호도 조사 1. 좋아하는 것과 싫어하는 것 2. 주어진 것 중, 선택하는 것
  • 23. 1. 좋아하는 것과 싫어하는 것 출현하는 곳과 안출현하는 곳의 특징을 비교 감귤류는 따뜻한 곳을 좋아하고, 추운 곳은 싫어한다
  • 24. 1. 좋아하는 것과 싫어하는 것 하지만 호불호가 그때 그때 바뀐다면? = 호불호가 명확한 타입 선택지에 따라 선호도가 바뀌는 타입도 있다
  • 25. 2. 주어진 것 중, 선택하는 것 선택지를 주고 선택한 곳의 특징을 파악 엄청 좋아하는 건 아니지만, 이 중에선 이걸 고를게 쓰레기를 좋아하진 않지만 주변에 먹을게 마땅치않다면… 다른 동물에 붙어있는 걸 좋아하지만 양식장이 있다면
  • 26. 2. 주어진 것 중, 선택하는 것 1. 좋아하는 것과 싫어하는 것 출현 자료와 비출현 자료: 선호하는 환경과 싫어하는 환경을 지시하는 정보 출현 자료와 배경자료: 선호하는 환경과 주어진 환경을 지시하는 정보
  • 27. 풀: 20% 모래: 70% 강: 10% 오리 분포 모형의 예시 풀 모래 강 오리 서식처는 주변의 풀, 모래, 강의 비율에 따라 결정된다. 출현 자료: 좋아하는 환경 비출현 자료: 싫어하는 환경 배경자료: 주어진 환경 주변의 범위
  • 28. 풀: 2 모래: 7 강: 1 출현 자료와 비출현 자료: 선호하는 환경과 싫어하는 환경을 지시하는 정보 풀: 10 모래: 0 강: 0 풀: 0 모래: 1 강: 9
  • 29. 풀: 2 모래: 7 강: 1 오리는 풀이 많은 곳에서 많이 있다. 오리는 강이 많은 곳에서 없었다 풀: 10 모래: 0 강: 0 풀: 0 모래: 1 강: 9 오리는 풀이 많은 곳을 좋아하고 강이 많은 곳을 싫어하니 오리 서식처는 풀이 많고 강이 적은 곳이다.
  • 30. 풀: 2 모래: 7 강: 1 풀: 10 모래: 0 강: 0 풀: 0 모래: 1 강: 9 출현 자료와 배경자료: 선호하는 환경과 주어진 환경을 지시하는 정보
  • 31. 풀: 2 모래: 7 강: 1 풀: 10 모래: 0 강: 0 풀: 0 모래: 1 강: 9 강이 많은 곳, 모래가 많은 곳, 풀이 많은 곳 중에서 오리는 풀이 많은 곳에서 많이 있다. 오리에게 풀 많은 곳, 모래 많은 곳, 강이 많은 곳을 다 보여주었으나 풀이 많은 곳을 주로 선택했으니 오리 서식처는 풀이 많고 강이 적은 곳이다.
  • 32. 종 분포 모형? 모형? 모델? 모델링? 𝑦𝑦 = 𝑎𝑎𝑥𝑥 + 𝑏𝑏 심박수 산소포화도 칼로리 소모 운동 횟수 내가 가진 정보 알고자 하는 정보 빛의 반사량 흡수량의 변화 정확하진 않지만, 추정은 할 수 있어
  • 34. 2. 주어진 것 중, 선택하는 것 1. 좋아하는 것과 싫어하는 것 출현 자료와 비출현 자료: 선호하는 환경과 싫어하는 환경을 지시하는 정보 출현 자료와 배경자료: 선호하는 환경과 주어진 환경을 지시하는 정보 𝑦𝑦 = 𝑎𝑎𝑥𝑥 + 𝑏𝑏 내가 가진 정보 알고자 하는 정보 서식처 적합도 출현 확률 출현 자료 비출현 자료 배경 자료 환경 변수
  • 35. 𝑦𝑦 = 𝑎𝑎𝑥𝑥 + 𝑏𝑏 환경 변수, 출현, 비출현, 배경 자료 서식처 적합도 통계 모형 Boosted Regression Tree Artificial Neural Network Maximum Entropy 선형 회귀, 기계학습, 딥러닝
  • 36. 학습 목표  종 분포 모형의 원리와 목적을 이해한다  종 분포 모형 결과를 해석하고 올바르게 추론할 수 있다  종 분포 모형의 적합 과정에 대해서 이해한다
  • 37. 실습 목표 • 자신이 관심있는 종을 선정하고 종 분포 모형 분석을 실시합니다. • 분석 결과를 토대로 팀 별로 최소 2페이지 분량의 분석 보고서를 작성합니다.
  • 38. R package Wallace  생물지리학자 Alfred Russel Wallace의 이름을 따 만든 종 분포 모형 분석 툴  복잡한 R 코드 없이 마우스 클릭만으로 종 분포 모형을 만들고 예측, 해석할 수 있음 Kass, J.M., et. al. (2022). wallace 2: a shiny app for modeling species niches and distributions redesigned to facilitate expansion via module contributions. Ecography, e06547. install.packages("wallace") wallace::run_wallace()
  • 39. Maximum Entropy algorithm  2004년 국제 기계학습 컨퍼런스에서 Steven J. Philips, Miroslav Dudík에 의해 처음 제시  출현 자료와 배경 자료를 사용하는 종 분포 모형 알고리즘  최대 엔트로피 이론에 기반  높은 예측 성능과 다양한 하이퍼 파라미터 조절 기능  2023년 기준 10,033회 인용(web of science 기준, Ecological modelling, 2006)
  • 40. Maximum Entropy algorithm  기계학습 전문가로써 AT&T 연구소에서 근무하던 중, 자신의 뉴욕 아파트 근처 미국 자연사 박물관을 방문  미국 자연사 박물관의 생물다양성 센터(CBC)의 센터장과 우연히 마주침  그들의 생물 다양성 보전을 위한 노력에 감명받아 컴퓨터 과학자로써 도울 수 있는 일에 대해서 이야기하고 아이디어를 얻음  2016년 AT&T에서 알고리즘의 코드 공개를 승인  JAVA(Maxent GUI)와 R(maxnet) 방식으로 사용 가능
  • 42. 출현자료 환경변수 출현 자료 선택 배경 자료 선택 환경 분석 출현 자료 분할 모델링 시각화 모형 전이 (예측) 결과 기록 분석의 순서 복잡한 설명은 생략합니다. 핑크색 박스를 눌러서 따라오세요.
  • 44. GBIF 데이터 베이스에서 종 학명 입력(e.g. Homo sapiens) 찾을 데이터의 최소 개수 입력 반드시 대문자! 스페이스 없도록 검색 실시
  • 45. WorldClim Bioclims 데이터베이스에서 환경 변수로 이동 마지막으로 로드 10 arcmin 해상도 선택(가장 조잡한 해상도) 옵션 선택
  • 46. 선택 지도에서 출현 자료 선택 출현 자료 결정 다각형 선택 폴리곤 그리고 Finish 설정
  • 47. 선택 배경 자료 범위 선정 방법 선택 최외곽 점들을 잇는 폴리곤에서 배경 자료 수집 선택 배경자료의 수:10,000 입력 선택 폴리곤을 보다 크게:3 입력
  • 48. 선택 비공간 출현 자료 구분 선택 교차검증 방법:Random k-fold 선택 K의 개수:5 입력 실행
  • 49. 선택 Maxent: 최대 엔트로피 모형 선택 Maxnet 사용 하이퍼파라미터1 -피처클래스: LQH 피처만 사용 하이퍼파라미터2 –규제 파라미터: 1 규제 파라미터만 사용 FALSE 사용 FALSE 사용 실행
  • 50. 분석 보고서 제출 – 3월 27일 월요일까지 • 자신이 관심있는 종을 선정하고 종 분포 모형 분석을 실시합니다. • 분석 결과를 토대로 최소 2페이지 분량의 분석 보고서를 팀 별로 작성합니다. • 오늘 다룬 내용 말고도 wallace 패키지에 있는 여러 다른 기능들을 사용해보세요. • 모형의 결과가 항상 정답은 아닙니다. 왜 이런 결과가 나왔는지 고민해보세요. • 모형 해석과 예측에 주의해야할 사항을 “근거를 들어” 서술해보세요. • 모형 분석을 함으로써 얻을 수 있는 이점을 고민해보세요. • 모형 분석의 단점은 무엇인지 고민해보세요. • 앞으로 모형을 개선시킨다면 어떻게 할 수 있는지 고민해보세요. • 모형 적합 단계 중 많은 선택들이 있었습니다. 여러 선택 옵션을 조사하고 해당 옵션이 모형 결과에 미치는 영향을 서술해보세요. Not necessary to answer all But recommended to include in the report 왼쪽의 내용을 보고서에 모두 담지 않아도 됩니다. 패키지를 다양하게 사용해보고 그 결과를 논리적으로 쓰면 됩니다.
  • 51. • 사용하는 변수가 기후 변수 밖에 없으므로 기후에 민감한 종을 선택하세요. • 최소한 100건의 출현 자료가 있는 종을 선택하세요. • Env Space 분석을 실시하려면 여러 종을 선택해야 합니다. • 질문이 있다면 [email protected] 로 자세한 맥락과 에러 내용을 보내주세요. 분석 보고서 제출 – 3월 27일 월요일까지