Организация анализа NGS
(Next-Generation sequencing)
данных в UGENE
Голосова Ольга
ООО НЦИТ «Унипро»
План
• Задача анализа данных секвенирования
• О проекте UGENE
• Сотрудничество с институтом NIAID
• Итоги
Секвенирование
Секвенирование ДНК — определение последовательности ДНК,
представление ее в цифровом виде.
Секвенирование
Высокоэффективное секвенирование (High-throughput или Next
Generation Sequencing) — группа различных методов, позволяющих
осуществлять секвенирование ДНК очень большого размера за одну
операцию.
Секвенирование
Зачем определять ДНК
• Персонализированная медицина
– Определение предрасположенности к болезням
– Более качественное проектирование лекарств (в
зависимости от генотипа и т.п.)
• Биоархеология, антропология, миграция
• Криминология
• Идентификация
• И многое другое
NGS данные
UGENE
UGENE — свободное кроссплатформенное биоинформационное
программное обеспечение [Okonechnikov K.; Golosova O.; Fursov M.; the
UGENE team. Unipro UGENE: a unified bioinformatics toolkit ;Bioinformatics
2012 28: 1166-1167].
Некоторые возможности:
• Редактор последовательностей
• Редактор множественных выравниваний
• Обозреватель сборок (Assembly Browser)
• Множество алгоритмов для анализа данных
• Автоматизация анализа (Workflow Designer)
Сотрудничество с NIAID
NIAID (National Institute of Allergy and Infectious Diseases) -
один из 27 институтов National Institutes of Health (NIH), USA
http://www.niaid.nih.gov/
Проблемы анализа NGS данных
• Разрозненность инструментов
• Несовместимость форматов
• Трудоемкость конфигурации
• Недоступность инcтрументов для разных ОС
• Запуск только из командной строки
• Много ручной рутинной работы
Цели сотрудничества
• NGS Pipelines:
– Variants Calling Pipeline
– Tuxedo Pipeline (RNA-Seq)
– Cistrome Pipeline (ChIP-Seq)
• Удобство работы:
– Pipeline wizards
– Dashboard
• Оценка времени выполнения, запуск на Amazon сервере
• А также:
– BioMart Integration
– DAS Integration
– Mobyle Integration
Variants Calling Pipeline
Поиск вариаций с помощью SAMtools:
Tuxedo Pipeline
Анализ RNA-Seq данных с помощью инструментов:
• TopHat (использует Bowtie, Bowtie2)
• Cufflinks
• Cuffmerge
• Cuffdiff
Cistrome Pipeline
Анализ ChIP-Seq данных с помощью инструментов:
• MACS
• CEAS
• peak2gene
• seqpos
• go_analysis
• conservation plot
Wizards
Dashboard
• Workflow Resources:
– workflow name;
– workflow start time;
– time left (finish time can be shown as a tooltip);
– percentage of the workflow running progress;
– amount of used memory;
– percentage of CPU usage;
• Output Files:
– clickable file name;
– the name of the workflow element that has produced the file;
– is it a temporary or final file;
– file status: is written, ready, deleted (for temporary files);
• Common Statistics
– number of messages that has been retrieved by an element, etc.;
Промежуточные итоги
• NGS Pipelines:
– Variants Calling Pipeline
– Tuxedo Pipeline (Linux, Mac OS)
– Cistrome Pipeline
• Удобство работы:
– Pipeline wizards
– Dashboard
• Оценка времени выполнения, запуск на Amazon сервере
• А также:
– BioMart Integration
– DAS Integration
– Mobyle Integration
• Довольный заказчик 
Спасибо за внимание

More Related Content

PDF
Hair care industry in Canada
PPTX
Болезнь XXI века - аллергия
PPTX
Основные возражения при продаже
PDF
Y11C - Allergy & Awareness
PPT
Маркетинговое исследование посетителей магазинов парфюмерии и косметики. Москва
PPTX
Офтальмология. От прошлого к настоящему
PPTX
Economical analysis of Cosmetic Industry
PPT
Overview of cosmetic industry
Hair care industry in Canada
Болезнь XXI века - аллергия
Основные возражения при продаже
Y11C - Allergy & Awareness
Маркетинговое исследование посетителей магазинов парфюмерии и косметики. Москва
Офтальмология. От прошлого к настоящему
Economical analysis of Cosmetic Industry
Overview of cosmetic industry

More from Marina_creautor (20)

PPTX
Sertifikaty prezentaciya
PDF
урнышев форум
PDF
тюрюшкин сиис2013 оптиплат (2)
PDF
сидоров безопасный район 02
PDF
котов лаборатория свободных решений
PDF
поздняков Ibm
PDF
кашин аис цон
PDF
королев пргноз
PDF
нек спо
PDF
карасев электронные услуги красноярска
PDF
горобцов услуги (1)
PDF
гоков мобильные приложения
PDF
зеленцов рои
PDF
горобцов услуги
PDF
ананьев мой новосибирск
PDF
гайдук барс
PPT
3 арьянова-cdek siis2013
PPTX
15 сиис 2013.павловскийен.баланс разработки и продвижения наукоёмких продуктов
PPTX
09 rodionov
PPTX
13 штокало ит в генетике
Sertifikaty prezentaciya
урнышев форум
тюрюшкин сиис2013 оптиплат (2)
сидоров безопасный район 02
котов лаборатория свободных решений
поздняков Ibm
кашин аис цон
королев пргноз
нек спо
карасев электронные услуги красноярска
горобцов услуги (1)
гоков мобильные приложения
зеленцов рои
горобцов услуги
ананьев мой новосибирск
гайдук барс
3 арьянова-cdek siis2013
15 сиис 2013.павловскийен.баланс разработки и продвижения наукоёмких продуктов
09 rodionov
13 штокало ит в генетике

голосова 17 niaid

  • 1. Организация анализа NGS (Next-Generation sequencing) данных в UGENE Голосова Ольга ООО НЦИТ «Унипро»
  • 2. План • Задача анализа данных секвенирования • О проекте UGENE • Сотрудничество с институтом NIAID • Итоги
  • 3. Секвенирование Секвенирование ДНК — определение последовательности ДНК, представление ее в цифровом виде.
  • 4. Секвенирование Высокоэффективное секвенирование (High-throughput или Next Generation Sequencing) — группа различных методов, позволяющих осуществлять секвенирование ДНК очень большого размера за одну операцию.
  • 6. Зачем определять ДНК • Персонализированная медицина – Определение предрасположенности к болезням – Более качественное проектирование лекарств (в зависимости от генотипа и т.п.) • Биоархеология, антропология, миграция • Криминология • Идентификация • И многое другое
  • 8. UGENE UGENE — свободное кроссплатформенное биоинформационное программное обеспечение [Okonechnikov K.; Golosova O.; Fursov M.; the UGENE team. Unipro UGENE: a unified bioinformatics toolkit ;Bioinformatics 2012 28: 1166-1167]. Некоторые возможности: • Редактор последовательностей • Редактор множественных выравниваний • Обозреватель сборок (Assembly Browser) • Множество алгоритмов для анализа данных • Автоматизация анализа (Workflow Designer)
  • 9. Сотрудничество с NIAID NIAID (National Institute of Allergy and Infectious Diseases) - один из 27 институтов National Institutes of Health (NIH), USA http://www.niaid.nih.gov/
  • 10. Проблемы анализа NGS данных • Разрозненность инструментов • Несовместимость форматов • Трудоемкость конфигурации • Недоступность инcтрументов для разных ОС • Запуск только из командной строки • Много ручной рутинной работы
  • 11. Цели сотрудничества • NGS Pipelines: – Variants Calling Pipeline – Tuxedo Pipeline (RNA-Seq) – Cistrome Pipeline (ChIP-Seq) • Удобство работы: – Pipeline wizards – Dashboard • Оценка времени выполнения, запуск на Amazon сервере • А также: – BioMart Integration – DAS Integration – Mobyle Integration
  • 12. Variants Calling Pipeline Поиск вариаций с помощью SAMtools:
  • 13. Tuxedo Pipeline Анализ RNA-Seq данных с помощью инструментов: • TopHat (использует Bowtie, Bowtie2) • Cufflinks • Cuffmerge • Cuffdiff
  • 14. Cistrome Pipeline Анализ ChIP-Seq данных с помощью инструментов: • MACS • CEAS • peak2gene • seqpos • go_analysis • conservation plot
  • 16. Dashboard • Workflow Resources: – workflow name; – workflow start time; – time left (finish time can be shown as a tooltip); – percentage of the workflow running progress; – amount of used memory; – percentage of CPU usage; • Output Files: – clickable file name; – the name of the workflow element that has produced the file; – is it a temporary or final file; – file status: is written, ready, deleted (for temporary files); • Common Statistics – number of messages that has been retrieved by an element, etc.;
  • 17. Промежуточные итоги • NGS Pipelines: – Variants Calling Pipeline – Tuxedo Pipeline (Linux, Mac OS) – Cistrome Pipeline • Удобство работы: – Pipeline wizards – Dashboard • Оценка времени выполнения, запуск на Amazon сервере • А также: – BioMart Integration – DAS Integration – Mobyle Integration • Довольный заказчик 