SlideShare a Scribd company logo
Цвет настроения
серый
Всем привет :)
➔ SEO-team lead ЛУН & Flatfy
➔ Куратор курса Product SEO
➔ SEO-консультант
Это я
Сайт #1 по недвижимости
в Украине
Международный бренд ЛУН
Запущено 37 стран
> 5 млн. > 4 млн.
пользователей в месяц пользователей в месяц
Что такое Google?
Section
1
Google - тоже продукт
08.11 SEMPRO Club - Влад Моргун - Цвет настроения серый
Типы апдейтов
Статистическая
значимость
В статистике величина(значение) переменной
называют статистически значимой, если мала
вероятность случайного возникновения этой или ещё
более крайних величин.
“Сезонность” апдейтов
Выводы:
● Все новые алгоритмы достаточно легко угадываются -
работаем на опыте
● Почему Google работает? Зарабатывает деньги.
● Сайты в ТОПе помогают заработать Google.
● Век удержания внимания и времени.
● Лучшие пользователи - которые проводят время.
Постоянно пользуются сервисом.
● Задал запрос - получил ответ.
“Вспомним все”
Section
2
Операторы:
● cache:
● intext:
● inposttitle:
● intitle:
● inurl:
● inanchor:
● filetype:
● around()
● or / and
● “ ”
● -  +
● site:  related:  info:
bit.ly/2IH5v0R - Power Searching
or
bit.ly/2KmWr74 - Courses list
Автоматизация
Section
3
SEO Цитатник :)
Масштабирование :)
SEO Цитатник :)
“Техническое доминирование”
Technical skills + Networking
bit.ly/semrush-experts-advices
John Mueller, Google Spokesman
You're going to run into significantly more JavaScript over
the next years than in the 2'ish decades in SEO before. If
you're keen on technical SEO, then past HTML you're
going to need to understand JS more and more.
Reddit: bit.ly/2AdU1B8
Что нужно знать SEOшнику?
1) HTML  CSS (CodeAcademy)
2) JS (learn.javascript.ru)
3) regex (regexr.com)  Bash Shell
4) HTTP (TutorialsPoint, Mozilla)
5) Python*
6) SQL
7) App Script*
8) git
bit.ly/2yl7q94 - выступление DVOMA
Тоже вариант
Примеры:
● Сбор семантики
● Разбор семантики (фильтрация 
кластеризация)
● Создание посадочных страниц
● Мониторинг (seo  доступность  изменения)
● Генерация текстов
● Автоматизация рутины
● Оценка доноров
● Ссылочное  аутрич
bit.ly/2PM17Wc - выступление WebPromo SEOday
Автоматизация:
ссылочноеSection
3.1
Машинное обучение
Класс методов искусственного интеллекта,
характерной чертой которых является не прямое
решение задачи, а обучение в процессе
применения решений множества сходных задач.
Примеры (способы):
● Обучение с учителем
(для каждого прецедента - «ситуация, требуемое решение»)
● Обучение без учителя
(для каждого прецедента задаётся только «ситуация»,
требуется сгруппировать объекты в кластеры, используя
данные о попарном сходстве объектов, и/или понизить
размерность данных)
● Обучение с подкреплением
(для каждого прецедента имеется пара «ситуация, принятое
решение»)
● ...
“Обучение на примерах”
Вид обучения, при котором интеллектуальной
системе предъявляется набор положительных и
отрицательных примеров, связанных с какой-
либо заранее неизвестной закономерностью.
Оценка доноров. Задача оптимизации
fdonor_quality
(a,b)=a1
fparam_1
(a,b)+a2
fparam_2
(a,b)+a3
fparam_3
(a,b)+...+an
1. Определение параметров для оценки
2. Апроксимация
3. Нормировка
4. Поиск коэффициентов
Полином
fdonor_quality
(a,b)=a1
fparam_1
(a,b)+a2
fparam_2
(a,b)+a3
fparam_3
(a,b)+...
+an
Апроксимация (линия тренда excel)
Нормирование
● Натуральный логарифм
● Оценка от 1 до 10
● Z-Score = ((измеренная величина) - (среднее
арифметическое))/среднеквадратическое
отклонение
Нахождение коэффициентов
Поиск решения
SOLVER.XLAM
Поиск решения
Поиск решения нелинейных задачи методом ОПГ
Оценка
Сайт серфер для оценок доноров
учителем
База сайтов
Оценка
доноров
Вывод
формулы
Авто оценка
Как разобраться?
https://ru.coursera.org/learn/machine-learning
https://developers.google.com/
machine-learning/crash-course/
Нейронные сети
Математическая модель, а также её
программное воплощение, построенная по
принципу организации и функционирования
биологических нейронных сетей —
последовательности нейронов, соединенных
между собой синапсами.
Нейронные сети
(по простому)
Нейрон – некая воображаемая чёрная коробка, у которой несколько
входных отверстий и одно выходное.
Как выходной сигнал формируется из кучи входных – определяет
внутренний алгоритм нейрона
Примеры (решения задач)
● Распознавание образов и классификация
● Принятие решений и управление
● Кластеризация
● Прогнозирование
● Аппроксимация
● Сжатие данных и Ассоциативная память
● Анализ данных
● Оптимизация
Платформа для соревнований по аналитике и
предсказательного моделирования.
Ирисы Фишера
● 3 вида ирисов
● Данные о 150 экземплярах ириса
● 50 экземпляров из трёх видов
● Требуется определить вид по измерениям
Ирисы Фишера в SEO
● Длина наружной доли околоцветника == Ahrefs DR
● Ширина наружной д.о. == SimilarWeb Traffic
● Длина внутренней д.о. == Trust Rank
● Ширина внутренней д.о. == SimilarWEb Organic Traffic
Как делать? ;)
Породы собак
https://www.kaggle.com/c/dog-breed-identification
Породы собак в SEO
● Колли == Партнёрские сайты
● Скотч-терьер == Конкуренты
● Комондор == Форумы
● Сенбернар == СМИ ресурсы
Как сделать?
● Собрать датасет
● Обучить нейронку
● Использовать
Собрать датасет?
● Установить Node.js (программная
платформа, превращающая JavaScript из
узкоспециализированного языка в язык
общего назначения)
● Через npm установить pageres (npm —
менеджер пакетов в Node)
● Написать .sh (или более сложное) с
командами
“pageres domain.com 1280x800 --format=jpg”
bit.ly/2SQ6odN
Обучить нейронку?
● Установить TensorFlow (открытая программная
библиотека для машинного обучения)
● Переобучить нейронку
● Протестировать
● Использовать
bit.ly/2RCnwST
Понимание разработки
Minimum:
https://codelabs.developers.google.com/
Результат
Автоматизация:
СЯ + текстыSection
3.2
Датасет (набор данных)
Использование данных
Использование данных
Доп. данные
http://wikimapia.org/api/
Известный метод
● Парсим Google
● Сохраняем Description
● Уникализируем
● Собираемсоздаем генеренные тексты
Проблема
ПАРСИМ GOOGLE
Решение
ГЕНЕРИМ Description САМИ
Ссылочный
Граф
Граф — абстрактный
математический объект,
представляющий собой
множество вершин
графа и набор рёбер, то
есть соединений между
парами вершин.
Google PageRank
PageRank (PR) — это вероятность перехода пользователя на
страницу, которая рассчитывается из анализа ссылочного
графа. Чем выше вероятность перехода на страницу, тем
выше авторитет данной страницы.
TextRank
● Пускай предложения - аналоги веб страниц
● Вероятность перехода от предложения A до B
эквивалентна схожести предложений
● Применим PageRank на граф предложений
Summary
Извлечение Обобщение
TextRank алгоритм
● Разбиваем текст на предложения (токенизатор)
● Поделим на слова
● Очистим от пробелов, знаков препинания…
● Обработаем стеммером (убираем окончания и префиксы)
● Уберем дубли слов из предложений
● Получим предложения в виде списков слов
● Для каждой пары предложений посчитаем похожесть
● Похожесть = одинаковые слова в предлож. / суммарная длина пр.
● Граф = вершины (номера предложений в тексте), ребра (схожесть)
● Считаем PageRank
● Берем по рейтингу
TextRank скачать
бесплатно, без
регистраций, без
смс
https://github.com/summanlp/textrank
Что умеет TextRank?
● Text summarization
● Keyword extraction
Особенности TextRank
● Зависит от языка
● Обучение без учителя
● Не “создает” контент
Логи
Section
4
-лось :)
НаДоске :)
bit.ly/2DrqAhG
Логи
Файл с записями о запросах (hit`ах), которые получил
сервер
Пример
192.168.1.11 - [03/Sep/2018:00:00:00 -0400] - "GET
/calendar/next HTTP/1.1" 200 - "Mozilla/5.0 (compatible;
Googlebot/2.1; +http://www.google.com/bot.html)"
Вопросы
1. Эффективно ли расходуется краулинговый бюджет?
2. Где идет утечка краулингового бюджета? (дубли, параметры и т.п.)
3. Были ли ошибки во время краулинга?
4. Какие есть области с недостатком краулинга?
5. Дата последнего краулинга?
Важно
Сколько прокрауленых страниц “non-compliant“?
(не подлежат попаданию в поиск)
Важно
1. Определить частоту сканирования страниц
2. Какие страницы не обходились ни разу за месяц?
3. Когда страницы прокраулены впервые после создания?
4. За какое время сканируются все страницы?
5. Какой тип файлов? %
6. Редиректы цепочки, ошибочные редиректы + кол-во
7. Количество заходов на не канонические страницы
8. Заходы на закрытые страницы в meta robots
9. Дублированный контент? (например, по тайтлам)
10. Сканирование нового контента
11. Миграция на HTTPS и работа с AMP
Kibana
SC
Сканирование закрытых
страниц
Пример dashboard
Приколюхи
Section
5
Определение географии
https://cloud.google.com/natural-language/
Определение ключевых фраз
bit.ly/2qAMRRz
Сохранение страниц в drive
https://github.com/hijonathan/google-scripts/blob/master/backup-url.j
s
● Бэкап HTML версий страничек
● Бэкап по датам
● Каждый день неделю  час
● Смотрим изменения у себя на сайте
● Смотрим изменения на других сайтах
● Скачиваем Google Support
Новое, а не лучше
Спасибо
за внимание!
Владислав Моргун
SEO Team-lead ЛУН & Flatfy
facebook.com/vladislav.morgun.3
t.me/m0r9un
vlad.morgun@lun.ua
instagram.com/m0r9un
О нас: team.lun.ua

More Related Content

PDF
15.03.19 WebPromo SEOday SEO-инсайты из логов: от WP блога до международного ...
Vladislav Morgun
 
PDF
Автоматизация SEO-процессов в продуктовых компаниях - DVOMA.pro 30.08
Vladislav Morgun
 
PDF
18.10.19 - WebPromo SEO day - Фазовый переход между стратами
Vladislav Morgun
 
PDF
Владислав Моргун
SEO.UA
 
PDF
26.03.19 Collaborator.pro Webinar Эффективные паттерны выбора доноров
Vladislav Morgun
 
PDF
19.10 - WebPromo SEO Day - "SEO-автоматизатор: кто он?" - Владислав Моргун
Vladislav Morgun
 
PPT
Продвижение порталов и инфосайтов. Дмитрий Шахов
Дмитрий Шахов
 
PDF
Никулин Павел. Machine learning для текстового анализа
Дмитрий Шахов
 
15.03.19 WebPromo SEOday SEO-инсайты из логов: от WP блога до международного ...
Vladislav Morgun
 
Автоматизация SEO-процессов в продуктовых компаниях - DVOMA.pro 30.08
Vladislav Morgun
 
18.10.19 - WebPromo SEO day - Фазовый переход между стратами
Vladislav Morgun
 
Владислав Моргун
SEO.UA
 
26.03.19 Collaborator.pro Webinar Эффективные паттерны выбора доноров
Vladislav Morgun
 
19.10 - WebPromo SEO Day - "SEO-автоматизатор: кто он?" - Владислав Моргун
Vladislav Morgun
 
Продвижение порталов и инфосайтов. Дмитрий Шахов
Дмитрий Шахов
 
Никулин Павел. Machine learning для текстового анализа
Дмитрий Шахов
 

What's hot (19)

PPTX
Дмитрий Петренко. SEO трафик в конкурентных нишах под БУРЖ. Инструменты, мето...
DariaShalahinova
 
PPTX
Дмитрий Шахов. Эксперименты на тему распространённых методов в SEO
DariaShalahinova
 
PDF
19.06.19 - MAD SEO Conf v.2.0 by Govitall - SEO-адаптация продуктов для выход...
Vladislav Morgun
 
PPTX
Q/A по PBN и западное SEO
NaZapad
 
PPT
Рутинные операции в SEO, о которых забывают и спрашивают снова и снова
Дмитрий Шахов
 
PPTX
Дмитрий Мазурян. Пять методик нестандартного анализа и поиска новых ниш
DariaShalahinova
 
PPTX
Артефакты эффективных SEOшников
Playtini
 
PPTX
Текстовые факторы при создании сеток сайтов
Playtini
 
PPT
Важность аналитики в SEO - доклад на 8p
SeoProfy Presentations
 
PPTX
Как с помощью правильных PBN, получать ТОП 1 в самых высоко конкурентных ниша...
SeoProfy Presentations
 
PPTX
Текстовый анализ - теория и практика
Alexey Chekushin
 
PDF
Игорь Горбенко (SerpStat): 5 фишек поисковой аналитики, которыми пользуются п...
NaZapad
 
PDF
Трудов Алексей. Как поисковые системы учитывают и оценивают возраст страницы
Дмитрий Шахов
 
PPTX
Гайд по текстовому антиспаму
Alexey Chekushin
 
PPTX
Footprint Factory - Nazapad 4
Andrey Kapeltsov
 
PPTX
Data Driven SEO на западных рынках - Виктор Карпенко
SeoProfy Presentations
 
PPTX
Необычные инструменты эффективных интернет-маркетологов
Playtini
 
PPT
Tagconf 13 - SphinxSearch - 2
Roman Kudlay
 
PDF
Кутас Иван. Практика оптимизации сайтов на незнакомых языках bdd2017
Дмитрий Шахов
 
Дмитрий Петренко. SEO трафик в конкурентных нишах под БУРЖ. Инструменты, мето...
DariaShalahinova
 
Дмитрий Шахов. Эксперименты на тему распространённых методов в SEO
DariaShalahinova
 
19.06.19 - MAD SEO Conf v.2.0 by Govitall - SEO-адаптация продуктов для выход...
Vladislav Morgun
 
Q/A по PBN и западное SEO
NaZapad
 
Рутинные операции в SEO, о которых забывают и спрашивают снова и снова
Дмитрий Шахов
 
Дмитрий Мазурян. Пять методик нестандартного анализа и поиска новых ниш
DariaShalahinova
 
Артефакты эффективных SEOшников
Playtini
 
Текстовые факторы при создании сеток сайтов
Playtini
 
Важность аналитики в SEO - доклад на 8p
SeoProfy Presentations
 
Как с помощью правильных PBN, получать ТОП 1 в самых высоко конкурентных ниша...
SeoProfy Presentations
 
Текстовый анализ - теория и практика
Alexey Chekushin
 
Игорь Горбенко (SerpStat): 5 фишек поисковой аналитики, которыми пользуются п...
NaZapad
 
Трудов Алексей. Как поисковые системы учитывают и оценивают возраст страницы
Дмитрий Шахов
 
Гайд по текстовому антиспаму
Alexey Chekushin
 
Footprint Factory - Nazapad 4
Andrey Kapeltsov
 
Data Driven SEO на западных рынках - Виктор Карпенко
SeoProfy Presentations
 
Необычные инструменты эффективных интернет-маркетологов
Playtini
 
Tagconf 13 - SphinxSearch - 2
Roman Kudlay
 
Кутас Иван. Практика оптимизации сайтов на незнакомых языках bdd2017
Дмитрий Шахов
 
Ad

Similar to 08.11 SEMPRO Club - Влад Моргун - Цвет настроения серый (20)

PPTX
SEO-аналитика: находим, анализируем, используем, усовершенствуем - 07.11.17 -...
Vladislav Morgun
 
PPTX
Медиаклуб «SEO для НКО: инструкция по применению»
Agency for social information
 
PDF
Seo-оптимизация сайта на WordPress
Yulia Krilova
 
PDF
Грамотная SEO-оптимизация сайта на WordPress
Igor Sazonov
 
PPTX
17
prmegaindex
 
PDF
20120226 information retrieval raskovalov_lecture03-04
Computer Science Club
 
PDF
20111001 information retrieval raskovalov_lecture2
Computer Science Club
 
PDF
20131112федорроманенко
Yandex
 
PDF
Как собрать трафик из Google с минимальными усилиями
Alexey Trudov
 
PDF
диплом
Gleb Lozhkovoy
 
PPTX
Алексей Рылко, iProspect — «SEO-инсайды, которые вы можете достать из логов ...
shevchuk_conf
 
PDF
20131105 романенко
Yandex
 
PPTX
Презентация Игорь Баньковский (Depositphotos) для NaZapad 3
NaZapad
 
PPTX
Презентация: модули 2-4, основы
EMPOpro
 
PPT
История поисковых машин
Darya Karelina
 
PPT
Russir 2010 final
yaevents
 
KEY
Практика SEO: Продвижение туристических сайтов
Evgeny Kostin
 
PPT
Почему оно не находится! / Андрей Аксенов (Sphinx)
Ontico
 
PDF
SEO по-белому для больших сайтов
Ihor Bankovskyi
 
PPT
Master class SEO
MageCloud
 
SEO-аналитика: находим, анализируем, используем, усовершенствуем - 07.11.17 -...
Vladislav Morgun
 
Медиаклуб «SEO для НКО: инструкция по применению»
Agency for social information
 
Seo-оптимизация сайта на WordPress
Yulia Krilova
 
Грамотная SEO-оптимизация сайта на WordPress
Igor Sazonov
 
20120226 information retrieval raskovalov_lecture03-04
Computer Science Club
 
20111001 information retrieval raskovalov_lecture2
Computer Science Club
 
20131112федорроманенко
Yandex
 
Как собрать трафик из Google с минимальными усилиями
Alexey Trudov
 
диплом
Gleb Lozhkovoy
 
Алексей Рылко, iProspect — «SEO-инсайды, которые вы можете достать из логов ...
shevchuk_conf
 
20131105 романенко
Yandex
 
Презентация Игорь Баньковский (Depositphotos) для NaZapad 3
NaZapad
 
Презентация: модули 2-4, основы
EMPOpro
 
История поисковых машин
Darya Karelina
 
Russir 2010 final
yaevents
 
Практика SEO: Продвижение туристических сайтов
Evgeny Kostin
 
Почему оно не находится! / Андрей Аксенов (Sphinx)
Ontico
 
SEO по-белому для больших сайтов
Ihor Bankovskyi
 
Master class SEO
MageCloud
 
Ad

More from Vladislav Morgun (10)

PDF
02.03.21 Collaborator.pro Webinar Решение 10 главных задач технической оптими...
Vladislav Morgun
 
PDF
13.03.2020 - NaZapad - SEO-Шива: продвижение 1 продукта на 30 стран
Vladislav Morgun
 
PDF
21.02.2020 - WebPromo SEO Day - О чем мы постоянно забываем при работе с сема...
Vladislav Morgun
 
PDF
30.08.19 - DVOMA.pro - Фреймворки для выбора и анализа новых ниш
Vladislav Morgun
 
PDF
14.06.19 GuruConf 2019 - Human-centered Link building
Vladislav Morgun
 
PDF
SEO Battle #2: 26.01 SEOclub & EVO
Vladislav Morgun
 
PDF
SEO-data для маркетинг инсайтов - Владислав Моргун 16.06 PRJCTR.com.ua
Vladislav Morgun
 
PDF
SEMPRO 2018 - Олег Искевич и Владислав Моргун - Тех-оптимизация и внутренние ...
Vladislav Morgun
 
PDF
WebPromo Experts Day - Олег Искевич и Владислав Моргун - Продвижение в высоко...
Vladislav Morgun
 
PDF
NaZapad 6 - Владислав Моргун - Семантическое ядро для 24 языков и 36 стран
Vladislav Morgun
 
02.03.21 Collaborator.pro Webinar Решение 10 главных задач технической оптими...
Vladislav Morgun
 
13.03.2020 - NaZapad - SEO-Шива: продвижение 1 продукта на 30 стран
Vladislav Morgun
 
21.02.2020 - WebPromo SEO Day - О чем мы постоянно забываем при работе с сема...
Vladislav Morgun
 
30.08.19 - DVOMA.pro - Фреймворки для выбора и анализа новых ниш
Vladislav Morgun
 
14.06.19 GuruConf 2019 - Human-centered Link building
Vladislav Morgun
 
SEO Battle #2: 26.01 SEOclub & EVO
Vladislav Morgun
 
SEO-data для маркетинг инсайтов - Владислав Моргун 16.06 PRJCTR.com.ua
Vladislav Morgun
 
SEMPRO 2018 - Олег Искевич и Владислав Моргун - Тех-оптимизация и внутренние ...
Vladislav Morgun
 
WebPromo Experts Day - Олег Искевич и Владислав Моргун - Продвижение в высоко...
Vladislav Morgun
 
NaZapad 6 - Владислав Моргун - Семантическое ядро для 24 языков и 36 стран
Vladislav Morgun
 

08.11 SEMPRO Club - Влад Моргун - Цвет настроения серый