<?xml version="1.0" encoding="utf-8"?> 
<rss version="2.0"
  xmlns:itunes="http://www.itunes.com/dtds/podcast-1.0.dtd"
  xmlns:atom="http://www.w3.org/2005/Atom">

<channel>

<title>Блог Антона Репушко: заметки с тегом анализ данных</title>
<link>https://repushko.com/tags/analiz-dannyh/</link>
<description>Блог Антона Репушко</description>
<author>Антон Репушко</author>
<language>ru</language>
<generator>E2 (v3565; Aegea)</generator>

<itunes:owner>
<itunes:name>Антон Репушко</itunes:name>
<itunes:email></itunes:email>
</itunes:owner>
<itunes:subtitle>Блог Антона Репушко</itunes:subtitle>
<itunes:image href="" />
<itunes:explicit></itunes:explicit>

<item>
<title>Дневник соревнования OpenEDS 2020</title>
<guid isPermaLink="false">49</guid>
<link>https://repushko.com/all/openeds2020/</link>
<pubDate>Tue, 04 Aug 2020 21:38:13 +0300</pubDate>
<author>Антон Репушко</author>
<comments>https://repushko.com/all/openeds2020/</comments>
<description>
&lt;p&gt;Мы со &lt;a href="https://www.linkedin.com/in/sviatoslav-skoblov"&gt;Святославом Скобловым&lt;/a&gt; 2 месяца решали &lt;a href="https://research.fb.com/programs/openeds-2020-challenge/"&gt;OpenEDS 2020 Challenge&lt;/a&gt;, где в одном треке заняли первое место, а во втором восьмое. Про второй трек тут не будет, потому что он скучный и не очень интересный. И ещё нас изредка консультировал Вова Михеюшкин по всяким CV-вопросам. Может быть кому-то тоже будет интересно почитать, как проходят соревнования по ML.&lt;/p&gt;
&lt;h2&gt;Про соревнование&lt;/h2&gt;
&lt;p&gt;На основе &lt;a href="https://arxiv.org/abs/2005.03876"&gt;датасета OpenEDS2020&lt;/a&gt;, собранного &lt;a href="https://research.fb.com/category/augmented-reality-virtual-reality/"&gt;Facebook Reality Labs&lt;/a&gt;, запустили два трека. Оба связаны с VR/AR, Oculus и всем таким. Треки шли в рамках &lt;a href="https://openeyes-workshop.github.io/"&gt;воркшопа к ECCV 2020&lt;/a&gt;.&lt;/p&gt;
&lt;div class="e2-text-picture"&gt;
&lt;img src="https://repushko.com/pictures/099.png" width="640" height="400" alt="" /&gt;
&lt;div class="e2-text-caption"&gt;Один из тысяч кадров&lt;/div&gt;
&lt;/div&gt;
&lt;p&gt;&lt;b&gt;В первом треке&lt;/b&gt; даны последовательности по 100 (трейн) и 55 (валидация) фотографий глаз с gaze-векторами каждого кадра. Представьте, что вы умеет стрелять лазерами из глаз. Вот отнормированный вектор из вашего зрачка до объекта на VR/AR экране и есть gaze-vector.&lt;br /&gt;
Частота записи последовательности — 100Гц. В тесте были те же последовательности по 50 кадров, но уже без настоящих векторов. Общая задача — научиться предсказывать по 50 кадрам последовательности в тесте следующие 5 кадров (т.e. 50мс). Нужно это для &lt;a href="https://en.wikipedia.org/wiki/Foveated_rendering"&gt;foveated rendering&lt;/a&gt;.&lt;/p&gt;
&lt;p&gt;&lt;b&gt;Во втором треке&lt;/b&gt; нужно было сегментировать части глаза (бэкграунд, склеру, радужку и зрачок) по кривой разметке 5% данных в каждой последовательности из 200 кадров. Многие (по отзывам других участников) боролись именно с кривой разметкой, мы же начали решать второй трек за 2 недели до конца и не слишком преуспели, хотя разрыв между топом очень маленький. Важнее и интереснее для нас был именно первый трек.&lt;/p&gt;
&lt;h2&gt;Технические особенности&lt;/h2&gt;
&lt;p&gt;Соревнование проводилось на платформе &lt;a href="https://evalai.cloudcv.org/"&gt;EvalAI&lt;/a&gt;. Там можно скрывать свои сабмиты, но перед этим на какую-то долю секунды они попадают на общую таблицу. Поэтому было решено написать своего бота, который бы мониторил изменения лидерборда, генерировал красивые картинки и присылал их в наш общий диалог. С помощью него мы могли трекать и отслеживать настоящих лидеров, а не те результаты, которые были показаны вручную.&lt;br /&gt;
Был только 1 сабмит в день, каждую ночь предыдущая возможность сабмита сгорала.&lt;/p&gt;
&lt;div class="e2-text-picture"&gt;
&lt;img src="https://repushko.com/pictures/lb.jpg" width="1280" height="897" alt="" /&gt;
&lt;div class="e2-text-caption"&gt;Команда BTSD скрыла свой сабмит&lt;/div&gt;
&lt;/div&gt;
&lt;p&gt;Своего железа у нас было не очень много, поэтому мы время от времени арендовали машины на &lt;a href="https://vast.ai/"&gt;vast.ai&lt;/a&gt;. Потратили на это около 230 долларов за 2 месяца соревнования.&lt;/p&gt;
&lt;h2&gt;Дневник&lt;/h2&gt;
&lt;p&gt;&lt;i&gt;1 июня&lt;/i&gt;&lt;br /&gt;
Создан чат в Телеграме, начали разбираться в предметной области, с платформой, читать правила. Выяснили, как части глаза называются на английском. Создали репозиторий на Гитхабе и настроили всем доступы.&lt;/p&gt;
&lt;div class="e2-text-picture"&gt;
&lt;img src="https://repushko.com/pictures/eye.jpg" width="500" height="239" alt="" /&gt;
&lt;/div&gt;
&lt;p&gt;&lt;i&gt;3 июня&lt;/i&gt;&lt;br /&gt;
Выкачиваются данные, визуально посмотрели gaze-вектора. Появляется идея классическими CV-методами поисков контуров искать зрачок на изображении и смотреть на изменение его положение внутри склеры. Разбираемся в типах движения глаза (саккады, скольжения, статичное положение и т. д.). Наконец-то понимаем вообще в чём суть трека.&lt;/p&gt;
&lt;p&gt;&lt;i&gt;4 июня&lt;/i&gt;&lt;br /&gt;
Нашли &lt;a href="https://pupil-labs.com/"&gt;pupil-labs&lt;/a&gt;, с помощью оборудования которых Facebook генерировал свой датасет. Ничего полезного, но очень интересно.&lt;br /&gt;
Научились находить зрачок обычными CV методами. В итоге это потом использовалось только в визуализациях.&lt;/p&gt;
&lt;div class="e2-text-picture"&gt;
&lt;img src="https://repushko.com/pictures/pupil_center.jpg" width="399" height="133" alt="" /&gt;
&lt;/div&gt;
&lt;p&gt;Пытались добавить ещё всяких контуров, но ничего не получилось.&lt;/p&gt;
&lt;div class="e2-text-picture"&gt;
&lt;img src="https://repushko.com/pictures/countur_orig.jpg" width="640" height="400" alt="" /&gt;
&lt;div class="e2-text-caption"&gt;Оригинальный кадр&lt;/div&gt;
&lt;/div&gt;
&lt;div class="e2-text-picture"&gt;
&lt;img src="https://repushko.com/pictures/countur.jpg" width="657" height="417" alt="" /&gt;
&lt;div class="e2-text-caption"&gt;Посчитанный контур&lt;/div&gt;
&lt;/div&gt;
&lt;p&gt;&lt;b&gt;Важное решение&lt;/b&gt;: посчитали правильным разделить пайплайн на две части: gaze-estimator (модель, которая по кадру предсказывает его gaze-вектор) и gaze-predictor (модель, которая по истории gaze-векторов предсказывает gaze-вектора следующих 5 кадров).&lt;/p&gt;
&lt;p&gt;&lt;i&gt;6 июня&lt;/i&gt;&lt;br /&gt;
Начали визуализировать вектора, чтобы посмотреть на всю последовательность целиком. Нам нужен gaze-predictor, но насколько сложным он будет? Если в данных в основном статичное положение глаза, то тогда сложная модель тут не нужна (так в итоге и оказалось).&lt;/p&gt;
&lt;div class="e2-text-picture"&gt;
&lt;img src="https://repushko.com/pictures/static_gaze.jpg" width="518" height="281" alt="" /&gt;
&lt;div class="e2-text-caption"&gt;Глаз практически неподвижен&lt;/div&gt;
&lt;/div&gt;
&lt;div class="e2-text-picture"&gt;
&lt;img src="https://repushko.com/pictures/saccade.jpg" width="423" height="358" alt="" /&gt;
&lt;div class="e2-text-caption"&gt;А тут уже двигается&lt;/div&gt;
&lt;/div&gt;
&lt;p&gt;Где-то тут было решено для обучения эстиматора (модели, которая будет по кадру предсказывать gaze-вектор) использовать &lt;a href="https://habr.com/ru/company/smartengines/blog/264677/"&gt;аугментации&lt;/a&gt;. Но проблема в том, что при изменении изображения нужно будет менять и изначальный вектор: вращаешь изображение -&gt; вращаешь вектор. Решили патчить &lt;a href="https://github.com/albumentations-team/albumentations"&gt;albumentations&lt;/a&gt;.&lt;/p&gt;
&lt;div class="e2-text-picture"&gt;
&lt;img src="https://repushko.com/pictures/vector_visualize.jpg" width="391" height="251" alt="" /&gt;
&lt;div class="e2-text-caption"&gt;Проекция вектора&lt;/div&gt;
&lt;/div&gt;
&lt;p&gt;&lt;i&gt;11 июня&lt;/i&gt;&lt;br /&gt;
Начали гонять первые модели, оптимизировать параметры. Стали разбираться с предиктором. Попробовали всякие стандартные штуки для форкаста временных рядов типа &lt;a href="https://facebook.github.io/prophet/"&gt;prophet&lt;/a&gt;, но они предсказуемо не зашли из-за специфики данных: нельзя вытащить сезонность (которой нет), другие фичи вроде дней недели, времени и прочего, что активно эксплуатируется в таких местах.&lt;br /&gt;
Обучили первый resnet для эстиматора.&lt;/p&gt;
&lt;p&gt;&lt;i&gt;12 июня&lt;/i&gt;&lt;br /&gt;
Скор первого трека: &lt;b&gt;0.1556&lt;/b&gt;&lt;/p&gt;
&lt;div class="e2-text-picture"&gt;
&lt;img src="https://repushko.com/pictures/submit.jpg" width="949" height="355" alt="" /&gt;
&lt;div class="e2-text-caption"&gt;Сделали первый сабмит (команда baccaddes)&lt;/div&gt;
&lt;/div&gt;
&lt;p&gt;Начали глубже разбираться с метрикой и сравнивать предикты модели с реальными данными, чтобы понять, где косяк. Настроили честную локальную валидацию эстиматора.&lt;/p&gt;
&lt;p&gt;&lt;i&gt;15 июня&lt;/i&gt;&lt;br /&gt;
Скор первого трека: &lt;b&gt; 0.0786&lt;/b&gt;&lt;/p&gt;
&lt;p&gt;Засабмитили улучшенную модель (VAR поверх хорошего эстиматора).&lt;br /&gt;
Это приблизило нас к остальным на ЛБ.&lt;/p&gt;
&lt;p&gt;&lt;i&gt;16 июня&lt;/i&gt;&lt;br /&gt;
Скор первого трека: &lt;b&gt;0.0747&lt;/b&gt;&lt;/p&gt;
&lt;p&gt;Написан и запущен Big Brother — бот, который следит за ЛБ. С этого момента до конца соревнования он работал с одним перебоем на полдня, после без ошибок.&lt;br /&gt;
Засабмитили скользящее среднее по 5 последним кадрам.&lt;/p&gt;
&lt;div class="e2-text-picture"&gt;
&lt;img src="https://repushko.com/pictures/submit_bot.jpg" width="1280" height="708" alt="" /&gt;
&lt;div class="e2-text-caption"&gt;Бот отрабатывает как надо&lt;/div&gt;
&lt;/div&gt;
&lt;p&gt;&lt;i&gt;17 июня&lt;/i&gt;&lt;/p&gt;
&lt;div class="e2-text-picture"&gt;
&lt;img src="https://repushko.com/pictures/ezgif.com-video-to-gif.gif" width="256" height="160" alt="" /&gt;
&lt;div class="e2-text-caption"&gt;Начали смотреть глазами на глаза (это анимация одной последовательности)&lt;/div&gt;
&lt;/div&gt;
&lt;p&gt;Посмотрели на статические генераторы таких данных (NVGaze и UnityEyes). В итоге для сореванования их так и не использовали.&lt;/p&gt;
&lt;p&gt;&lt;i&gt;22 июня&lt;/i&gt;&lt;br /&gt;
Предикт эстиматора очень грязный: колбасит вектора между кадрами и получается, что между ними как будто бы сильное движение глаза.&lt;/p&gt;
&lt;p&gt;&lt;i&gt;28 июня&lt;/i&gt;&lt;br /&gt;
Подумали, что было бы классно научиться группировать авторов одних и тех же последовательностей (количество участников при сборе датасета на порядки меньше числа последовательностей), чтобы вытаскивать оттуда какие-то фичи специфичные для конкретного участника. Эту идею так и не доделали.&lt;/p&gt;
&lt;p&gt;Начали думать про классическое CV снова: хотели вытаскивать крайние точки глаз и прочее.&lt;/p&gt;
&lt;p&gt;Обучили LSTM для предиктора. Сработало чуточку хуже средних по 5 кадрам.&lt;/p&gt;
&lt;p&gt;&lt;i&gt;29 июня&lt;/i&gt;&lt;br /&gt;
Закончили патчить albumentations.&lt;/p&gt;
&lt;div class="e2-text-picture"&gt;
&lt;img src="https://repushko.com/pictures/orig.jpg" width="387" height="251" alt="" /&gt;
&lt;div class="e2-text-caption"&gt;Оригинальный кадр&lt;/div&gt;
&lt;/div&gt;
&lt;div class="e2-text-picture"&gt;
&lt;img src="https://repushko.com/pictures/flipped.jpg" width="385" height="249" alt="" /&gt;
&lt;div class="e2-text-caption"&gt;Сработавший Vertical Flip (и пересчитанный вектор)&lt;/div&gt;
&lt;/div&gt;
&lt;div class="e2-text-picture"&gt;
&lt;img src="https://repushko.com/pictures/shift_scale_rotate.jpg" width="380" height="247" alt="" /&gt;
&lt;div class="e2-text-caption"&gt;Живой ShiftScaleRotate&lt;/div&gt;
&lt;/div&gt;
&lt;p&gt;&lt;i&gt;1 июля&lt;/i&gt;&lt;br /&gt;
Начали подозревать, что в тесте всё таки в основном статика. И что самый большой буст тут даст улучшение эстиматора, а не предиктора.&lt;/p&gt;
&lt;p&gt;Нафигачили для эстиматора аугментаций.&lt;/p&gt;
&lt;p&gt;&lt;i&gt;4 июля&lt;/i&gt;&lt;br /&gt;
Скор первого трека: &lt;b&gt;0.0613&lt;/b&gt;&lt;/p&gt;
&lt;p&gt;Стали думать, как сделать интереснее предиктор. Взяли потыкать &lt;a href="https://github.com/unit8co/darts"&gt;darts&lt;/a&gt; — это такой враппер над всякими стандартными моделями для форкаста.&lt;/p&gt;
&lt;p&gt;Запустили старый метод среднего по кадрам (или какую-то оч простую эвристику) над данными нового эстиматора. Очень сильно улучшились.&lt;/p&gt;
&lt;p&gt;&lt;i&gt;5 июля&lt;/i&gt;&lt;br /&gt;
Скор первого трека: &lt;b&gt;0.0570&lt;/b&gt;&lt;/p&gt;
&lt;p&gt;Выучили пачку effnet’ов (до этого был resnet). Начали дробить на фолды и мешать предикты с разных фолдов.&lt;/p&gt;
&lt;p&gt;Сняли тачку на &lt;a href="https://vast.ai"&gt;vast.ai&lt;/a&gt;.&lt;/p&gt;
&lt;p&gt;Посмотрели на тестовые данные на основе более-менее нормальных предиктов эстиматора. Оказалось, что какая-то динамика в последних 10 кадрах последовательности есть всего в 600-700 последовательностях из 6400.&lt;/p&gt;
&lt;p&gt;Засабмитил старые методы предикта на среднем фолдов effnet’а. Почти до самого конца это было нашим лучшим результатом и первым местом на ЛБ.&lt;/p&gt;
&lt;p&gt;&lt;i&gt;9 июля&lt;/i&gt;&lt;br /&gt;
Обучили mobnet. Стали экспериментировать с предиктором: ExponentialSmoothing, VAR, ARIMA и т. д.&lt;br /&gt;
Методы ничего не докинули, а некоторые и ухудшили скор относительно просто среднего.&lt;br /&gt;
Скор самого предиктора при этом был очень хороший, около 0.000400+ на кадр по их метрике.&lt;/p&gt;
&lt;p&gt;Первый раз открыли данные второго трека, порисовали маски.&lt;/p&gt;
&lt;div class="e2-text-picture"&gt;
&lt;img src="https://repushko.com/pictures/mask.jpg" width="1098" height="1034" alt="" /&gt;
&lt;/div&gt;
&lt;p&gt;&lt;i&gt;10 июля&lt;/i&gt;&lt;br /&gt;
Засабмитили скользящее среднее по 3 кадрам на куче разных фолдов — не сработало.&lt;/p&gt;
&lt;p&gt;Постарались достраивать вектора регрессией. Тоже не сработало.&lt;/p&gt;
&lt;p&gt;&lt;i&gt;11 июля&lt;/i&gt;&lt;br /&gt;
Начали играться с фильтрами над сигналом, чтобы сгладить разницу предиктов эстиматора между соседними кадрами. Получалось хорошо, использовали &lt;a href="https://en.wikipedia.org/wiki/Savitzky%E2%80%93Golay_filter"&gt;фильтр Савицки-Голая&lt;/a&gt;. Кажется, что всякие неровности эстиматора очень красиво сглаживаются.&lt;/p&gt;
&lt;div class="e2-text-picture"&gt;
&lt;img src="https://repushko.com/pictures/savgol_2.jpg" width="751" height="558" alt="" /&gt;
&lt;/div&gt;
&lt;p&gt;&lt;i&gt;12 июля&lt;/i&gt;&lt;br /&gt;
Разбирались с предиктором. Выяснили, что наша регрессия багованная и искали ошибку в разнице валидаций друг у друга. Нашли. Смотрели глазами на фильтрованные предикты и думали, что делать дальше.&lt;/p&gt;
&lt;p&gt;&lt;i&gt;14 июля&lt;/i&gt;&lt;br /&gt;
Нарисовали красивые картинки градиентов по разным осям между двумя соседними кадрами по предиктам на всём тесте. Выяснили, что у нас действительно всё — статика. Поэтому опять же нет смысла во всяких сложных моделях предиктора.&lt;/p&gt;
&lt;div class="e2-text-picture"&gt;
&lt;img src="https://repushko.com/pictures/gradient_x.jpg" width="664" height="422" alt="" /&gt;
&lt;/div&gt;
&lt;p&gt;Выяснили, что локальная метрика эстиматора напрямую коррелирует с результатами на ЛБ и что результат одного хорошего фолда лучше, чем его же со смесью фолдов чуть-чуть хуже. Опять упёрлись в то, что надо дотюнивать эстиматор. Вернулись к resnet’у.&lt;/p&gt;
&lt;p&gt;&lt;i&gt;14 июля — 23 июля&lt;/i&gt;&lt;br /&gt;
Скор первого трека: &lt;b&gt;0.0552&lt;/b&gt;&lt;/p&gt;
&lt;p&gt;Разбирались с сегментацией, удивлялись кривой разметке, сложным случая с закрытыми глазами и т. д.&lt;/p&gt;
&lt;p&gt;Вытюнили 1 фолд для эстиматора до ошибки 0.000197 (в 3 раза лучше прошлых). В предиктор засунули простую эвристику: если статика, то скользящее среднее по 2 последним кадрам, а если была динамика в последних 5 кадрах, то добавляем градиент дальше до упора (из-за особенностей движения глаза, там бОльшая часть движений — линейная).&lt;/p&gt;
&lt;p&gt;&lt;i&gt;23 июля — 29 июля&lt;/i&gt;&lt;br /&gt;
Тюнили и думали над сегментацией. Смотрели на то, как нам применить синтетические данные в сегментаци. Генерировали синтетику.&lt;/p&gt;
&lt;div class="e2-text-picture"&gt;
&lt;img src="https://repushko.com/pictures/unity_eye.jpg" width="1148" height="648" alt="" /&gt;
&lt;div class="e2-text-caption"&gt;Типичный несуществующий глаз&lt;/div&gt;
&lt;/div&gt;
&lt;p&gt;Из интересного: один сабмит пропустили, потому что кое-кто заснул от усталости и не слышал звонков с просьбой прислать данные. Два сабмита в два дня были сделаны за 30 и 20 секунд до сгорания.&lt;/p&gt;
&lt;div class="e2-text-picture"&gt;
&lt;img src="https://repushko.com/pictures/sega.png" width="720" height="720" alt="" /&gt;
&lt;div class="e2-text-caption"&gt;Кусочек каких-то сравнений моделей по сегментации&lt;/div&gt;
&lt;/div&gt;
&lt;p&gt;&lt;i&gt;30 июля — 31 июля&lt;/i&gt;&lt;br /&gt;
Скор первого трека: &lt;b&gt;0.0537&lt;/b&gt;&lt;/p&gt;
&lt;p&gt;Смотрели и думали над всякими сложными случаями в сегментации&lt;/p&gt;
&lt;div class="e2-text-picture"&gt;
&lt;img src="https://repushko.com/pictures/sega2.jpg" width="1280" height="287" alt="" /&gt;
&lt;/div&gt;
&lt;div class="e2-text-picture"&gt;
&lt;img src="https://repushko.com/pictures/sega3.jpg" width="1280" height="277" alt="" /&gt;
&lt;/div&gt;
&lt;p&gt;По первому треку доучили остальные бленды эстиматора, сблендили и засабмитили. Так и осталось нашим лучшим результатом.&lt;/p&gt;
&lt;p&gt;По сегментации остались на 8ом месте.&lt;/p&gt;
&lt;h2&gt;Что хотели попробовать, но не попробовали&lt;/h2&gt;
&lt;ul&gt;
&lt;li&gt;Не использовали никакую синтетику, а скорее всгео надо было бы. Можно и в обоих треках&lt;/li&gt;
&lt;li&gt;Надо было учить LSTM на чистых данных (в том числе из теста и из трейна) и сразу на векторах. Наши эвристики в итоге были по каждой оси отдельно&lt;/li&gt;
&lt;/ul&gt;
</description>
</item>

<item>
<title>Как работает очистка данных со stat.gibdd.ru</title>
<guid isPermaLink="false">47</guid>
<link>https://repushko.com/all/data-cleaning-stat-gibdd-ru/</link>
<pubDate>Thu, 25 Jun 2020 23:15:15 +0300</pubDate>
<author>Антон Репушко</author>
<comments>https://repushko.com/all/data-cleaning-stat-gibdd-ru/</comments>
<description>
&lt;p&gt;Год назад &lt;a href="https://repushko.com/all/dtp-stat-helpers/"&gt;написал скрипты&lt;/a&gt; для очистки данных статистики ДТП, потому что изначальные данные (именно GPS-координаты) были очень грязными  и их практически нельзя было визуализировать. Сорцы на Гитхабе &lt;a href="https://github.com/repushko/dtp_stat_helpers"&gt;имеются&lt;/a&gt;.&lt;/p&gt;
&lt;p&gt;Сейчас скрипты временно неработоспособны, так как Яндексовский геокодер теперь требует ключ для использования API, но скоро я их поправлю.&lt;/p&gt;
&lt;p&gt;Я расскажу про красивый и аккуратный способ, как нам точку с неправильными координатами аккуратно подвинуть прямо на улицу, где произошло ДТП.&lt;/p&gt;
&lt;div class="e2-text-picture"&gt;
&lt;img src="https://repushko.com/pictures/graph_explanation.jpg" width="1280" height="960" alt="" /&gt;
&lt;div class="e2-text-caption"&gt;Алгоритм очистки данных&lt;/div&gt;
&lt;/div&gt;
&lt;h2&gt;Описаниме по шагам&lt;/h2&gt;
&lt;p&gt;Изначально нам дана синяя точка слева внизу. Это GPS-координаты, которые мы получили из исходных данных. Наша основная зацепка — адрес. Он заполняется вручную и обычно верный.&lt;/p&gt;
&lt;p&gt;&lt;b&gt;Шаг 1.&lt;/b&gt; Воспользуемся геокодером. Это такая программа, которая переводит географическое название (город/село/улицу + дом) в географические координаты. Я обычно пользуюсь &lt;a href="https://tech.yandex.com/maps/geocoder/"&gt;геокодером Яндекса&lt;/a&gt;, потому что он точнее для СНГ, но ещё есть &lt;a href="https://nominatim.org/"&gt;бесплатный от OpenStreetMap&lt;/a&gt;. Так мы получаем чистую координату дома по адресу (красная точка на рисунке).&lt;/p&gt;
&lt;p&gt;&lt;b&gt;Шаг 2.&lt;/b&gt; В OSM хранится граф дорог, при этом они привязаны к географическим координатам (у графа есть точное положение на плоскости). И есть классная особенность: мы можем ввести координаты точки на плоскости и получить кусок графа в радиусе n от этой точки. Общая идея такая:&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;вводим координаты дома после геокодирования -&gt; получаем круг примерно как на картинке,&lt;/li&gt;
&lt;li&gt;выбираем все дороги, попавшие в радиус (можно считать их просто линиями),&lt;/li&gt;
&lt;li&gt;строим перпендикуляры из точки до каждой из линий (на рисунке x и y),&lt;/li&gt;
&lt;li&gt;выбираем кратчайший (в нашем случае x),&lt;/li&gt;
&lt;li&gt;наша красная точка получает новые координаты (уже на ребре графа из OSM) и становится жёлтой точкой,&lt;/li&gt;
&lt;li&gt;profit.&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;Так мы кривые координаты ДТП по одному лишь адресу аккуратно перенесли прямо на улицу. Теперь при визуализации всё будет аккуратно и ровно.&lt;/p&gt;
</description>
</item>

<item>
<title>Типы улиц Тулы</title>
<guid isPermaLink="false">46</guid>
<link>https://repushko.com/all/street-types-tula/</link>
<pubDate>Sun, 07 Jun 2020 23:54:35 +0300</pubDate>
<author>Антон Репушко</author>
<comments>https://repushko.com/all/street-types-tula/</comments>
<description>
&lt;p&gt;Раз уж пошла такая мода (&lt;a href="https://erdavis.com/2019/09/20/the-beautiful-hidden-logic-of-cities-worldwide/"&gt;оригинальная идея Эрина Дэвиса&lt;/a&gt;, &lt;a href="https://t.me/pathetic_low_freq/319"&gt;Москва&lt;/a&gt;, &lt;a href="https://vk.com/astr.city.data?w=wall-51262629_141"&gt;Астрахань&lt;/a&gt;), то и я нарисовал карту типов улиц Тулы.&lt;/p&gt;
&lt;div class="e2-text-picture"&gt;
&lt;img src="https://repushko.com/pictures/map.png" width="2560" height="2560" alt="" /&gt;
&lt;/div&gt;
&lt;p&gt;Интересно выглядят плотные участки, состоящие только из проездов. Вроде как согласно СНиП (Строительные нормы и правила), к проездам меньше требований по ширине полос, допустимым углам поворота, наибольшему допустимому уклону, ширине пешеходной части.&lt;/p&gt;
&lt;p&gt;А ещё в Туле есть особенный тип: «обвод». Он всего один (&lt;a href="https://yandex.ru/maps/15/tula/search/%D0%92%D0%BE%D1%81%D1%82%D0%BE%D1%87%D0%BD%D1%8B%D0%B9%20%D0%BE%D0%B1%D0%B2%D0%BE%D0%B4/?ll=37.662604%2C54.185500&amp;z=14.64"&gt;Восточной обвод&lt;/a&gt;), но всё таки существует. И целых два проспекта.&lt;/p&gt;
</description>
</item>

<item>
<title>Датасет структуры сети Lightning</title>
<guid isPermaLink="false">44</guid>
<link>https://repushko.com/all/dataset-struktury-seti-lightning/</link>
<pubDate>Fri, 22 May 2020 02:02:05 +0300</pubDate>
<author>Антон Репушко</author>
<comments>https://repushko.com/all/dataset-struktury-seti-lightning/</comments>
<description>
&lt;p&gt;Ковыряю в свободное время интересную тему и задачу, которую курирует &lt;a href="https://cs.hse.ru/en/lambda/"&gt;LAMBDA&lt;/a&gt;.&lt;/p&gt;
&lt;h2&gt;Вводная&lt;/h2&gt;
&lt;p&gt;Есть сеть &lt;a href="https://lightning.network/"&gt;Лайтнинг&lt;/a&gt;, которая является надстройкой над майннетом Биткоина. Придумывалась для более мелких транзакций, которые не позволял делать Биткоин. Например, тебе нужно заплатить за кофе или совершить какую-то маленькую операцию.&lt;/p&gt;
&lt;p&gt;Основная терминология:&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;нода — узел сети. Получатель денег в общем,&lt;/li&gt;
&lt;li&gt;канал — ребро сети. Общий кошелёк в майннете Биткоина между двумя нодами.&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;В Лайтнинге интересный механизм поиска пути транзакции. Eсли тебе надо перевести деньги из &lt;i&gt;А&lt;/i&gt; в &lt;i&gt;С&lt;/i&gt;, то не обязательно открывать новый общий кошелёк в майннете Биткоина.&lt;/p&gt;
&lt;p&gt;Предположим у тебя уже есть канал &lt;i&gt;А&lt;-&gt;B&lt;/i&gt; и есть канал &lt;i&gt;B&lt;-&gt;C&lt;/i&gt;. В таком случае ты можешь сделать перевод &lt;i&gt;A-&gt;B-&gt;C&lt;/i&gt;, где &lt;i&gt;B&lt;/i&gt; за проход транзакции через себя возьмёт какую-то комиссию. А можно перевести и предположим по пути &lt;i&gt;A&gt;D-&gt;B-&gt;C&lt;/i&gt;, если такой существует.&lt;/p&gt;
&lt;p&gt;Но не всё так просто. Помимо комиссии, на транзакцию накладываются дополнительные условия. У канала есть «ёмкость»: сколько можно переслать денег между двумя нодами без создания нового общего кошелька в майннете. И «ёмкость» &lt;i&gt;А-&gt;B&lt;/i&gt; и &lt;i&gt;B-&gt;A&lt;/i&gt; не одно и то же.&lt;/p&gt;
&lt;p&gt;Подробнее и больше можно почитать &lt;a href="https://lightning.network/"&gt; в документации&lt;/a&gt;.&lt;/p&gt;
&lt;h2&gt;Цель&lt;/h2&gt;
&lt;p&gt;Основная идея ресёча — заменить глупый перебор результатов DFS для проведения транзакции на что-то более умное. Кажется, что это можно сделать, имея статистику «прошедших» транзакций и варианты альтернативных путей. Получиться должно что-то вроде статистического роутинга на основе прошлых транзакций.&lt;br /&gt;
Для этого нужно собирать датасет таких транзакций и их альтернатив, но это упирается в некоторые технические сложности и проблемы. Я собственно сейчас пытаюсь их решить, проверяя вообще работоспособность идеи сбора таких данных. Если получится, то будет очень классное и необычное решение.&lt;/p&gt;
&lt;h2&gt;Датасет&lt;/h2&gt;
&lt;p&gt;До этого этапа хотелось посмотреть (и посмотрели) просто на динамику сети, как она меняется и насколько стабильна. Написал простенький парсер и в итоге получился &lt;a href="https://www.kaggle.com/grisme/hourly-snapshots-of-lightning-network"&gt;датасет на 10 Gb&lt;/a&gt; «слепков» сети: рёбра графа и всякая метаинфа нод (ip-адрес, алиас в сети и гео-координаты).&lt;/p&gt;
&lt;p&gt;Парсилось каждый час с 10.12.2019 до 04.03.2020 (84 дня), всего 2022 записи. Каждый результат в отдельном файле со своим временем.&lt;/p&gt;
&lt;p&gt;На этом датасете можно построить интересные визуализации динамики графа и прочие клёвые штуки. Почему бы собственно им не поделиться, да?&lt;/p&gt;
</description>
</item>

<item>
<title>«Средненько». Проверка гипотезы</title>
<guid isPermaLink="false">41</guid>
<link>https://repushko.com/all/srednenko-poc/</link>
<pubDate>Sun, 26 Apr 2020 01:05:52 +0300</pubDate>
<author>Антон Репушко</author>
<comments>https://repushko.com/all/srednenko-poc/</comments>
<description>
&lt;h2&gt;Мотивация&lt;/h2&gt;
&lt;p&gt;Я 3-4 года назад услышал про исследование &lt;a href="https://strelka-kb.com/"&gt;КБ «Стрелка»&lt;/a&gt;, в котором они скрапили фото из социальных сетей (Инстаграм и ВК) и рисовали хитмапы на картах по ним. Оказывается, это называется &lt;a href="https://strelkamag.com/ru/article/est-takaya-professiya-cifrovoi-antropolog"&gt;цифровой антропологией&lt;/a&gt;.&lt;/p&gt;
&lt;p&gt;Идея кейса, который вдохновил меня, в том, что такое исследование помогло в каком-то там городе РФ выбрать лучшую точку для открытия общественного пространства. Гипотеза такая: если люди где-то делают фото, значит уже проводят там время, а значит там и так всё хорошо с социальной жизнью. В итоге администрации посоветовали открыть новую точку интереса на противоположном конце города от существующей.&lt;/p&gt;
&lt;p&gt;Загорелся идеей сделать нечто похожее, но в сферу каких-то постоянных событий идея оставалась идеей без реализации.&lt;/p&gt;
&lt;p&gt;Закрывая гештальт (как Инстаграм своё API для доступа к гео-информации о фотографиях в 2016-ом) достиг успеха.&lt;/p&gt;
&lt;h2&gt;Реализация&lt;/h2&gt;
&lt;p&gt;Т. к. API Инстаграма оказалось закрытым, решил воспользоваться &lt;a href="https://www.flickr.com/"&gt;Flickr’ом&lt;/a&gt;.&lt;br /&gt;
Суть идеи:&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;берем 2019ый год,&lt;/li&gt;
&lt;li&gt;cкрапим фотографии с Flickr для конкретной локации (т.e. города),&lt;/li&gt;
&lt;li&gt;аккуратно накладываем на карту,&lt;/li&gt;
&lt;li&gt;видим места, где люди много фотографируют,&lt;/li&gt;
&lt;li&gt;делаем какие-то выводы.&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;&lt;b&gt;Например&lt;/b&gt;: люди фотографируют -&gt; там что-то интересное -&gt; логично поселиться во время поездки.&lt;/p&gt;
&lt;p&gt;&lt;b&gt;Другой например&lt;/b&gt;: можно увидеть места, которые недостаточно освещены туристически (с точки зрения наличия фотографий) и можно выбрать наоборот район, где живут местные. На примере Берлина эта теория вроде как работает.&lt;/p&gt;
&lt;div class="e2-text-picture"&gt;
&lt;img src="https://repushko.com/pictures/berlin_flickr_project_2019.jpg" width="1280" height="684" alt="" /&gt;
&lt;div class="e2-text-caption"&gt;Фотографии в Берлине за 2019ый год&lt;/div&gt;
&lt;/div&gt;
&lt;p&gt;Найденные подводные камни:&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;API Flickr’a частично не завелось из python-обертки, которую я нашёл,&lt;/li&gt;
&lt;li&gt;фотографий не так много (250к за год), как в Инстаграме. С геопозицией — еще меньше. За 2019ый год только 44к для Берлина,&lt;/li&gt;
&lt;li&gt;на карте прямыми линиями из фотографий заметны фотопрогулки, когда один человек шел и фотографировал всё, что видел. Так получается много фотографий одного места, хотя это всего лишь от одного человека. В планах написать кастомную функцию хитмапа, которая бы давала больший вес участкам, где фотографии от разных людей. Так получится сильно честнее.&lt;/li&gt;
&lt;/ul&gt;
&lt;h2&gt;«Средненько»&lt;/h2&gt;
&lt;p&gt;В процессе возникла идея — сопоставить кучу фотографий одной достопримечательности для получения её «усреднённого» вида. Итог получился сильно лучше, чем я ожидал.&lt;/p&gt;
&lt;div class="e2-text-picture"&gt;
&lt;img src="https://repushko.com/pictures/ansgar-scheffold-cyUf9E_mhFc-unsplash.jpg" width="2560" height="1701" alt="" /&gt;
&lt;div class="e2-text-caption"&gt;Оригинальные Бранденбургские ворота&lt;/div&gt;
&lt;/div&gt;
&lt;div class="e2-text-picture"&gt;
&lt;img src="https://repushko.com/pictures/average_brandenburg_gates.jpg" width="1280" height="774" alt="" /&gt;
&lt;div class="e2-text-caption"&gt;Усреднённые 55 фотографий Бранденбургских ворот&lt;/div&gt;
&lt;/div&gt;
&lt;p&gt;Когда-то вероятно продолжу и сделаю для других городов.&lt;/p&gt;
</description>
</item>

<item>
<title>Баркоды сериала «Tales from the Loop»</title>
<guid isPermaLink="false">37</guid>
<link>https://repushko.com/all/barkody-seriala-tales-from-the-loop/</link>
<pubDate>Tue, 21 Apr 2020 15:24:26 +0300</pubDate>
<author>Антон Репушко</author>
<comments>https://repushko.com/all/barkody-seriala-tales-from-the-loop/</comments>
<description>
&lt;p&gt;Сделал баркоды, как и с &lt;a href="https://repushko.com/all/barkody-seriala-chernobyl/"&gt;сериалом «Чернобыль»&lt;/a&gt;. Каждая полоса — средний цвет кадра в этот момент времени.&lt;/p&gt;
&lt;div class="e2-text-picture"&gt;
&lt;img src="https://repushko.com/pictures/S1E1.jpg" width="1700" height="400" alt="" /&gt;
&lt;div class="e2-text-caption"&gt;«Loop»&lt;/div&gt;
&lt;/div&gt;
&lt;div class="e2-text-picture"&gt;
&lt;img src="https://repushko.com/pictures/S1E2.jpg" width="1700" height="400" alt="" /&gt;
&lt;div class="e2-text-caption"&gt;«Transpose»&lt;/div&gt;
&lt;/div&gt;
&lt;div class="e2-text-picture"&gt;
&lt;img src="https://repushko.com/pictures/S1E3.jpg" width="1700" height="400" alt="" /&gt;
&lt;div class="e2-text-caption"&gt;«Stasis»&lt;/div&gt;
&lt;/div&gt;
&lt;div class="e2-text-picture"&gt;
&lt;img src="https://repushko.com/pictures/S1E4.jpg" width="1700" height="400" alt="" /&gt;
&lt;div class="e2-text-caption"&gt;«Echo Sphere»&lt;/div&gt;
&lt;/div&gt;
&lt;div class="e2-text-picture"&gt;
&lt;img src="https://repushko.com/pictures/S1E5.jpg" width="1700" height="400" alt="" /&gt;
&lt;div class="e2-text-caption"&gt;«Control»&lt;/div&gt;
&lt;/div&gt;
&lt;div class="e2-text-picture"&gt;
&lt;img src="https://repushko.com/pictures/S1E6.jpg" width="1700" height="400" alt="" /&gt;
&lt;div class="e2-text-caption"&gt;«Parallel»&lt;/div&gt;
&lt;/div&gt;
&lt;div class="e2-text-picture"&gt;
&lt;img src="https://repushko.com/pictures/S1E7.jpg" width="1700" height="400" alt="" /&gt;
&lt;div class="e2-text-caption"&gt;«Enemies»&lt;/div&gt;
&lt;/div&gt;
&lt;div class="e2-text-picture"&gt;
&lt;img src="https://repushko.com/pictures/S1E8.jpg" width="1700" height="400" alt="" /&gt;
&lt;div class="e2-text-caption"&gt;«Home»&lt;/div&gt;
&lt;/div&gt;
</description>
</item>

<item>
<title>Маленькое исследование в эпидемиологии</title>
<guid isPermaLink="false">29</guid>
<link>https://repushko.com/all/malenkiy-resech-v-epidemiologii/</link>
<pubDate>Mon, 30 Mar 2020 11:31:31 +0300</pubDate>
<author>Антон Репушко</author>
<comments>https://repushko.com/all/malenkiy-resech-v-epidemiologii/</comments>
<description>
&lt;div class="e2-text-picture"&gt;
&lt;img src="https://repushko.com/pictures/picture1.jpg" width="1280" height="483" alt="" /&gt;
&lt;/div&gt;
&lt;p&gt;&lt;a href="https://habr.com/ru/company/ods/blog/493200/"&gt;Написали на Хабре&lt;/a&gt; вместе с заинтересовавшимися из ODS про модель распространения абстрактного вируса по РФ. Опирались на датасет перевозок за апрель 2019ого, которые дали &lt;a href="https://tutu.ru"&gt;tutu.ru&lt;/a&gt;. Огромное спасибо Сергею (&lt;a href="https://t.me/red_spades"&gt;Milfgard&lt;/a&gt;) за это, без его инициативы ничего бы не было.&lt;/p&gt;
&lt;p&gt;Полезное действие — показать, что изоляция и ограничение перемещения действительно помогают снизить темпы распространения.&lt;/p&gt;
&lt;p&gt;В статье немножко технических подробностей, но лично мне захотелось теперь лучше разобраться в эпидемиологии и их моделях.&lt;/p&gt;
&lt;p&gt;Я тут отвечал за получение полезного и осмысливаемого результата за короткий срок, саму статью и красивые видосы, которые удобнее всего смотреть на скорости 0.25.&lt;/p&gt;
&lt;p&gt;На видео симуляция на полгода вперёд. Легенда карты:&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;размер метки зависит от населения города. Больше населения — больше метка,&lt;/li&gt;
&lt;li&gt;цвет метки зависит от числа инфицированных (&lt;span style="color:#19994d"&gt;зеленый&lt;/span&gt; — мало, &lt;span style="color:#e12a21"&gt;красный&lt;/span&gt; — очень много),&lt;/li&gt;
&lt;li&gt;если в городе нет инфицированных — он не показывается на карте. Так легко увидеть первые случаи и путь распространения.&lt;/li&gt;
&lt;/ul&gt;
&lt;div class="e2-text-video"&gt;
&lt;iframe src="https://www.youtube.com/embed/nhtFZo2e59k" frameborder="0" allowfullscreen&gt;&lt;/iframe&gt;&lt;div class="e2-text-caption"&gt;Полный пассажиропоток, нет никакой изоляции&lt;/div&gt;
&lt;/div&gt;
&lt;div class="e2-text-video"&gt;
&lt;iframe src="https://www.youtube.com/embed/SC7hrwh_nC0" frameborder="0" allowfullscreen&gt;&lt;/iframe&gt;&lt;div class="e2-text-caption"&gt;10% от пассажиропотока, есть небольшая социальная изоляция&lt;/div&gt;
&lt;/div&gt;
</description>
</item>

<item>
<title>Tesla и нейронные сети</title>
<guid isPermaLink="false">28</guid>
<link>https://repushko.com/all/tesla-i-nn/</link>
<pubDate>Mon, 03 Feb 2020 20:17:38 +0300</pubDate>
<author>Антон Репушко</author>
<comments>https://repushko.com/all/tesla-i-nn/</comments>
<description>
&lt;p&gt;&lt;a href="https://twitter.com/elonmusk/status/1224182478501482497?s=20"&gt;https://twitter.com/elonmusk/status/1224182478501482497?s=20&lt;/a&gt;&lt;/p&gt;&lt;p&gt;Илон Маск упомянул, что в Тесле прототипы сеток набрасываются на Python, а реализуются и работают на голом железе или C/C++. Интересно конечно, у них свой рантайм для них, или какие-то инженеры успешные эксперименты переписывают?&lt;/p&gt;
&lt;p&gt;В любом случае мысль, что рантайм NN (обработка запросов и т. д.) должен быть максимально близко к железу очень правильная. Поэтому не люблю упаковывать модели в проде в Flask-контейнеры или какую-то ещё python-обёртку сверху.&lt;/p&gt;
&lt;p&gt;Вообще кажется есть тренд на производительный ML (отчасти из-за работы в реальном времени) и на фоне этого TensorRT/OpenVINO и подобные штуки будут всё популярнее.&lt;/p&gt;
&lt;p&gt;Эх, когда-то даже писал шаблон сервиса на Go, чтобы xgboost-модельки гонять.&lt;/p&gt;
</description>
</item>

<item>
<title>Интерполяция кадров и ML</title>
<guid isPermaLink="false">25</guid>
<link>https://repushko.com/all/frames-interpolation-and-ml/</link>
<pubDate>Sun, 02 Feb 2020 23:14:13 +0300</pubDate>
<author>Антон Репушко</author>
<comments>https://repushko.com/all/frames-interpolation-and-ml/</comments>
<description>
&lt;p&gt;На выходных потыкал в &lt;a href="https://en.wikipedia.org/wiki/Motion_interpolation"&gt;интерполяцию кадров&lt;/a&gt; с помощью нейронных сетей. Я смотрел на &lt;a href="https://github.com/sniklaus/sepconv-slomo"&gt;статью с CVPR 2018&lt;/a&gt;, но результаты лучше сейчас показывает &lt;a href="https://github.com/baowenbo/DAIN"&gt;DAIN с CVPR 2019&lt;/a&gt;.&lt;/p&gt;
&lt;p&gt;В результате получился «Ёжик в тумане» и «Ух ты, говорящая рыба!» в 120 fps, но я не могу никуда их загрузить из-за авторских прав. Хотя бы youtube позволяет показать небольшое демо.&lt;/p&gt;
&lt;p&gt;Получаются очень интересные артефакты на кадрах с падением листа дуба.&lt;/p&gt;
&lt;div class="e2-text-video"&gt;
&lt;iframe src="https://www.youtube.com/embed/S-WotUGnWyw" frameborder="0" allowfullscreen&gt;&lt;/iframe&gt;&lt;/div&gt;
</description>
</item>

<item>
<title>Карта всех фонарей Москвы</title>
<guid isPermaLink="false">23</guid>
<link>https://repushko.com/all/moscow-lightning/</link>
<pubDate>Wed, 29 Jan 2020 19:55:18 +0300</pubDate>
<author>Антон Репушко</author>
<comments>https://repushko.com/all/moscow-lightning/</comments>
<description>
&lt;p&gt;Случайно сделал карту всех фонарей Москвы. Данные стащил с &lt;a href="https://data.mos.ru/."&gt;https://data.mos.ru/.&lt;/a&gt;&lt;/p&gt;
&lt;div class="e2-text-picture"&gt;
&lt;div class="fotorama" data-width="1632" data-ratio="1.8093126385809"&gt;
&lt;img src="https://repushko.com/pictures/Screenshot-from-2020-01-29-17-50-18.png" width="1632" height="902" alt="" /&gt;
&lt;img src="https://repushko.com/pictures/Screenshot-from-2020-01-29-17-53-47.png" width="1644" height="902" alt="" /&gt;
&lt;/div&gt;
&lt;div class="e2-text-caption"&gt;Каждая точка — отдельный фонарь&lt;/div&gt;
&lt;/div&gt;
</description>
</item>

<item>
<title>Junction 2019 — русские, русские, русские, VK</title>
<guid isPermaLink="false">20</guid>
<link>https://repushko.com/all/junction-2019/</link>
<pubDate>Mon, 18 Nov 2019 16:11:17 +0300</pubDate>
<author>Антон Репушко</author>
<comments>https://repushko.com/all/junction-2019/</comments>
<description>
&lt;div class="e2-text-picture"&gt;
&lt;img src="https://repushko.com/pictures/Screenshot-from-2019-11-17-07-41-05.png" width="732" height="173" alt="" /&gt;
&lt;/div&gt;
&lt;p&gt;Был на выходных на Junction-2019 (топовый европейский хакатон в Хельсинки), а это заметка фактами по свежим следам.&lt;/p&gt;
&lt;h2&gt;Выжимка&lt;/h2&gt;
&lt;p&gt;Русские, русские, автобусы из Питера, иностранцы придумывают, как интегрировать VK с AliExpress 🤯, ещё русские, детская безопасность в интернете, клёвое название нашего проекта, купленные шрифты, Люси в восторге, треки не очень, старость.&lt;/p&gt;
&lt;h2&gt;Чуть более развёрнуто&lt;/h2&gt;
&lt;p&gt;Похоже Junction окончательно стал главной выездной площадкой для IT-шников в СНГ. Русскоговорящих было по ощущениям больше половины. Приглашения для визы генерил скриптик на сайте, это ли не победа над бюрократией?&lt;/p&gt;
&lt;p&gt;Вспомнил, что он же в 2016 был моим первым выездным IT-мероприятием и атмосфера была совсем другой: пиццабургеры, Yousician с укулеле, на которых можно было играть ночью, лазерный луч через всё пространство мероприятия. Тогда это чувствовалось как что-то близкое, организованное такими же как и ты. Сейчас — построенный бизнес, который (видимо успешно) штампует мероприятия для студентов и ищет спонсоров. Ну и призы подросли.&lt;/p&gt;
&lt;p&gt;Чувствовалась старость и лень: зачем не спать всю ночь, когда после сна ты сможешь что-то пофиксить за 20 минут? Зачем не спать, когда в понедельник на работу?&lt;/p&gt;
&lt;h2&gt;Победители&lt;/h2&gt;
&lt;ol start="1"&gt;
&lt;li&gt;Приложение для авторизации детей, которые ещё не умеют читать и писать (а потреблять контент хочется) в соцсетях. Суть в том, что ты придумываешь историю с вымышленными персонажами, и вот эта твоя история и становится паролем.&lt;/li&gt;
&lt;li&gt;Симуляция потоков людей на мероприятии. Создали комнатку в игровом движке, наплодили агентов, хакнули A* алгоритм и ПОБЕЖАЛИ ВСЕ НА ВЫХОД ПОЖАРНАЯ ТРЕВОГА УПС, ТЫ СГОРЕЛ И НЕ ДОБЕЖАЛ. Демка выглядела классно.&lt;/li&gt;
&lt;li&gt;Оказывается, фины очень много тратят на гэмблинг. Ребята сделали рулетку на телефоне, где проигранные деньги отправляются тебе на банковский счёт и вернутся к тебе только через год.&lt;/li&gt;
&lt;/ol&gt;
&lt;h2&gt;sad but true&lt;/h2&gt;
&lt;p&gt;В итоге мы с Дашей набросали вдвоём маленькое демо приложения для личного контроля финансов, собрав в кучку все лучшие идеи, которые нашлись в других приложениях (типа burnout-char’a для отслеживания твоего ежедневного бюджета). Сервер я уже грохнул, так что есть только скрины. Возможно как-то допилим и сделаем интеграцию со своими банковскими аккаунтами. Оказывается в Европе это сильно проще, чем с российскими банками.&lt;/p&gt;
&lt;p&gt;Называется sad but true, потому что в миллениальном настоящем денег у тебя сильно меньше, чем приходит с ЗП на карту: это на квартирку, это на Netflix, а за Spotify кто заплатит, Пушкин? Вот и хочется, чтобы оно там само где-то считалось, списывалось, советовало как сэкономить, а ты повиновался бы бездушным if-else и средним по окнам в временных рядах.&lt;/p&gt;
&lt;p&gt;Фронтендик на Svelte оказался удобным. Мне как глупому `if err!= nil ` бэкендеру прям самое то.&lt;/p&gt;
&lt;div class="e2-text-picture"&gt;
&lt;div class="fotorama" data-width="603" data-ratio="0.64561027837259"&gt;
&lt;img src="https://repushko.com/pictures/Screenshot-from-2019-11-17-07-31-28.png" width="603" height="934" alt="" /&gt;
&lt;img src="https://repushko.com/pictures/Screenshot-from-2019-11-17-07-31-41.png" width="869" height="938" alt="" /&gt;
&lt;img src="https://repushko.com/pictures/Screenshot-from-2019-11-17-07-31-55.png" width="680" height="923" alt="" /&gt;
&lt;/div&gt;
&lt;/div&gt;
</description>
</item>

<item>
<title>Счастливый конец мойсеверозапад.рф</title>
<guid isPermaLink="false">17</guid>
<link>https://repushko.com/all/schastlivy-konec-moyseverozapad-rf/</link>
<pubDate>Wed, 24 Jul 2019 02:16:34 +0300</pubDate>
<author>Антон Репушко</author>
<comments>https://repushko.com/all/schastlivy-konec-moyseverozapad-rf/</comments>
<description>
&lt;p&gt;Мы в &lt;a href="https://corgilab.ru"&gt;КоргиЛаб&lt;/a&gt; успешно запустили &lt;a href="https://repushko.com/all/moyseverozapad-rf/"&gt;мойсеверозапад.рф&lt;/a&gt; 5 месяцев назад и сейчас готовы сообщить о результатах исследований и полученных данных.&lt;/p&gt;
&lt;p&gt;Основная цель запуска — помочь магистрантке архитектурного ВУЗа успешно написать и защитить диплом об открытом проектировании в формировании общественных пространств жилого района. Диплом успешно написано и сдан на отлично, время подводить результаты.&lt;/p&gt;
&lt;p&gt;Отфильтровав некорректные данные (например больше 5 отметок одного типа с одной анкеты), получили 263 предложения по категориям:&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;65 «Досуг»,&lt;/li&gt;
&lt;li&gt;64 «Спорт»,&lt;/li&gt;
&lt;li&gt;44 «События»,&lt;/li&gt;
&lt;li&gt;43 «Дети»,&lt;/li&gt;
&lt;li&gt;47 собственных идей жителей.&lt;/li&gt;
&lt;/ul&gt;
&lt;div class="e2-text-picture"&gt;
&lt;img src="https://repushko.com/pictures/Screenshot-2019-07-24-at-02.14.58.png" width="1918" height="1017" alt="" /&gt;
&lt;div class="e2-text-caption"&gt;Финальное состояние карты&lt;/div&gt;
&lt;/div&gt;
&lt;div class="e2-text-picture"&gt;
&lt;img src="https://repushko.com/pictures/Screenshot-2019-07-24-at-02.11.53.png" width="661" height="499" alt="" /&gt;
&lt;div class="e2-text-caption"&gt;Статистика посещений&lt;/div&gt;
&lt;/div&gt;
</description>
</item>

<item>
<title>Santander 2019 на Kaggle: 52 место</title>
<guid isPermaLink="false">12</guid>
<link>https://repushko.com/all/santander-2019/</link>
<pubDate>Sat, 20 Apr 2019 22:47:40 +0300</pubDate>
<author>Антон Репушко</author>
<comments>https://repushko.com/all/santander-2019/</comments>
<description>
&lt;p&gt;С коллегами из &lt;a href="https://ods.ai"&gt;ODS&lt;/a&gt; заняли 52ое место в соревновании на Kaggle среди 8800 команд.&lt;br /&gt;
Santander в этот раз молодцы: обошлось почти без ликов.&lt;/p&gt;
&lt;p&gt;Данные были странные и несколько тысяч команд застряли на скоре 0.901. В итоге сильно докинула частотность значения признака и хороший тюнинг.&lt;/p&gt;
&lt;p&gt;Kaggle = веселье.&lt;/p&gt;
</description>
</item>

<item>
<title>Летние школы по машинному обучению 2019</title>
<guid isPermaLink="false">5</guid>
<link>https://repushko.com/all/ml-ss-2019/</link>
<pubDate>Fri, 22 Feb 2019 18:19:07 +0300</pubDate>
<author>Антон Репушко</author>
<comments>https://repushko.com/all/ml-ss-2019/</comments>
<description>
&lt;p&gt;Собрал список летних школ, все проходят в Европе.&lt;/p&gt;
&lt;p&gt;Отсортировано по дате начала. None в поле значит, что я не нашел информацию.&lt;/p&gt;
&lt;p&gt;В комментарии можно писать о школах, которых нет в списке, или о недочетах.&lt;/p&gt;
&lt;div class="e2-text-table"&gt;
&lt;table cellpadding="0" cellspacing="0" border="0"&gt;
&lt;tr&gt;
&lt;td&gt;&lt;b&gt;Название&lt;/b&gt;&lt;/td&gt;
&lt;td&gt;&lt;b&gt;Место&lt;/b&gt;&lt;/td&gt;
&lt;td&gt;&lt;b&gt;Даты&lt;/b&gt;&lt;/td&gt;
&lt;td&gt;&lt;b&gt;Цена&lt;/b&gt;&lt;/td&gt;
&lt;td&gt;&lt;b&gt;Сроки подачи&lt;/b&gt;&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td&gt;&lt;a href="http://www.neurodynamic.uottawa.ca/summer.html"&gt;Summer School of the Centre for Neural Dynamics&lt;/a&gt;&lt;/td&gt;
&lt;td&gt;Оттава, Канада&lt;/td&gt;
&lt;td&gt;с 26.05 по 07.06&lt;/td&gt;
&lt;td&gt;None&lt;/td&gt;
&lt;td&gt;конец — 15.02&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td&gt;&lt;a href="https://nassma.um6p.ma"&gt;NASSMA MLSS&lt;/a&gt;&lt;/td&gt;
&lt;td&gt;Бен-Герир, Марокко&lt;/td&gt;
&lt;td&gt;с 24.06 по 29.06&lt;/td&gt;
&lt;td&gt;None&lt;/td&gt;
&lt;td&gt;конец — 15.03&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td&gt;&lt;a href="http://ciss.deephack.me"&gt;2nd Conversational Intelligence Summer School&lt;/a&gt;&lt;/td&gt;
&lt;td&gt;Лоуэл, США&lt;/td&gt;
&lt;td&gt;с 24.06 по 29.06&lt;/td&gt;
&lt;td&gt;450$ — 900$&lt;/td&gt;
&lt;td&gt;конец — 25.03&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td&gt;&lt;a href="http://2019.dl-lab.eu"&gt;International Summer School on Deep Learning&lt;/a&gt;&lt;/td&gt;
&lt;td&gt;Гданьск, Польша&lt;/td&gt;
&lt;td&gt;с 1.07 по 5.07&lt;/td&gt;
&lt;td&gt;195€ — 245€&lt;/td&gt;
&lt;td&gt;конец — 10.03&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td&gt;&lt;a href="https://sites.google.com/view/dlnlp2019/home"&gt;NLPDL 2019&lt;/a&gt;&lt;/td&gt;
&lt;td&gt;Барселона, Испания&lt;/td&gt;
&lt;td&gt;с 26.06 по 3.07&lt;/td&gt;
&lt;td&gt;None&lt;/td&gt;
&lt;td&gt;None&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td&gt;&lt;a href="https://www.eeml.eu"&gt;Eastern European MLSS&lt;/a&gt;&lt;/td&gt;
&lt;td&gt;Бухарест, Румыния&lt;/td&gt;
&lt;td&gt;с 1.07 по 6.07&lt;/td&gt;
&lt;td&gt;100€ — 300€&lt;/td&gt;
&lt;td&gt;конец — 29.03&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td&gt;&lt;a href="https://indico.cern.ch/event/768915/overview"&gt;The Fifth Machine Learning in High Energy Physics Summer School&lt;/a&gt;&lt;/td&gt;
&lt;td&gt;—Гамбург, Германия&lt;/td&gt;
&lt;td&gt;c 1.07 по 10.07&lt;/td&gt;
&lt;td&gt;300€&lt;/td&gt;
&lt;td&gt;конец — 17.03&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td&gt;&lt;a href="https://rlss.inria.fr/"&gt;Reinforcement Learning Summer SCOOL&lt;/a&gt;&lt;/td&gt;
&lt;td&gt;Лиль, Франция&lt;/td&gt;
&lt;td&gt;с 1.07 по 12.07&lt;/td&gt;
&lt;td&gt;480€ — 1920€&lt;/td&gt;
&lt;td&gt;конец — 15.03&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td&gt;&lt;a href="http://visum.inesctec.pt"&gt;VISion Understanding and Machine intelligence — VISUM 2019&lt;/a&gt;&lt;/td&gt;
&lt;td&gt;Порту, Португалия&lt;/td&gt;
&lt;td&gt;с 04.07 по 12.07&lt;/td&gt;
&lt;td&gt;100€ — 600€&lt;/td&gt;
&lt;td&gt;конец — 22.03&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td&gt;&lt;a href="http://school-raai.org"&gt;RAAI Summer School&lt;/a&gt;&lt;/td&gt;
&lt;td&gt;Москва, Россия&lt;/td&gt;
&lt;td&gt;с 4.07 по 7.07&lt;/td&gt;
&lt;td&gt;50$&lt;/td&gt;
&lt;td&gt;конец — None&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td&gt;&lt;a href="https://www.fh-ooe.at/en/hagenberg-campus/international/international-events/summer-school-2019/"&gt;The Summer School of Informatics, Communications, and Media&lt;/a&gt;&lt;/td&gt;
&lt;td&gt;Хагенберг, Австрия&lt;/td&gt;
&lt;td&gt;с 8.07 по 14.07&lt;/td&gt;
&lt;td&gt;free — 350€&lt;/td&gt;
&lt;td&gt;конец — 30.04&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td&gt;&lt;a href="http://lxmls.it.pt/2019/"&gt;LXMLS&lt;/a&gt;&lt;/td&gt;
&lt;td&gt;Лиссабон, Португалия&lt;/td&gt;
&lt;td&gt;с 11.07 по 18.07&lt;/td&gt;
&lt;td&gt;300€ — 600€&lt;/td&gt;
&lt;td&gt;конец — 31.03&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td&gt;&lt;a href="http://deeplearn2019.irdta.eu"&gt;3rd International Summer School on Deep Learning&lt;/a&gt;&lt;/td&gt;
&lt;td&gt;Варшава, Польша&lt;/td&gt;
&lt;td&gt;с 22.07 по 26.07&lt;/td&gt;
&lt;td&gt;340€ — 520€&lt;/td&gt;
&lt;td&gt;конец — 2.03&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td&gt;&lt;a href="https://dlinnlp.github.io/index.html"&gt;RANLP’19 Summer School on Deep Learning in Natural Language Processing&lt;/a&gt;&lt;/td&gt;
&lt;td&gt;Варна, Болгария&lt;/td&gt;
&lt;td&gt;с 29.08 по 30.08&lt;/td&gt;
&lt;td&gt;None&lt;/td&gt;
&lt;td&gt;None&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td&gt;&lt;a href="http://deepbayes.ru/"&gt;Summer school on Deep Learning and Bayesian Methods&lt;/a&gt;&lt;/td&gt;
&lt;td&gt;Москва, Россия&lt;/td&gt;
&lt;td&gt;с 20.08 по 25.08&lt;/td&gt;
&lt;td&gt;1000₽ — 30000₽&lt;/td&gt;
&lt;td&gt;конец — 15.04&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td&gt;&lt;a href="https://mlss-skoltech.github.io/"&gt;MLSS-Skoltech&lt;/a&gt;&lt;/td&gt;
&lt;td&gt;Москва, Россия&lt;/td&gt;
&lt;td&gt;с 26.08 по 06.09&lt;/td&gt;
&lt;td&gt;None&lt;/td&gt;
&lt;td&gt;начало — 4.03, конец — 5.04&lt;/td&gt;
&lt;/tr&gt;
&lt;/table&gt;
&lt;/div&gt;
</description>
</item>


</channel>
</rss>