<?xml version="1.0" encoding="utf-8"?> 
<rss version="2.0"
  xmlns:itunes="http://www.itunes.com/dtds/podcast-1.0.dtd"
  xmlns:atom="http://www.w3.org/2005/Atom">

<channel>

<title>Блог Антона Репушко: заметки с тегом питон</title>
<link>https://repushko.com/tags/piton/</link>
<description>Блог Антона Репушко</description>
<author>Антон Репушко</author>
<language>ru</language>
<generator>E2 (v3565; Aegea)</generator>

<itunes:owner>
<itunes:name>Антон Репушко</itunes:name>
<itunes:email></itunes:email>
</itunes:owner>
<itunes:subtitle>Блог Антона Репушко</itunes:subtitle>
<itunes:image href="" />
<itunes:explicit></itunes:explicit>

<item>
<title>Дневник соревнования OpenEDS 2020</title>
<guid isPermaLink="false">49</guid>
<link>https://repushko.com/all/openeds2020/</link>
<pubDate>Tue, 04 Aug 2020 21:38:13 +0300</pubDate>
<author>Антон Репушко</author>
<comments>https://repushko.com/all/openeds2020/</comments>
<description>
&lt;p&gt;Мы со &lt;a href="https://www.linkedin.com/in/sviatoslav-skoblov"&gt;Святославом Скобловым&lt;/a&gt; 2 месяца решали &lt;a href="https://research.fb.com/programs/openeds-2020-challenge/"&gt;OpenEDS 2020 Challenge&lt;/a&gt;, где в одном треке заняли первое место, а во втором восьмое. Про второй трек тут не будет, потому что он скучный и не очень интересный. И ещё нас изредка консультировал Вова Михеюшкин по всяким CV-вопросам. Может быть кому-то тоже будет интересно почитать, как проходят соревнования по ML.&lt;/p&gt;
&lt;h2&gt;Про соревнование&lt;/h2&gt;
&lt;p&gt;На основе &lt;a href="https://arxiv.org/abs/2005.03876"&gt;датасета OpenEDS2020&lt;/a&gt;, собранного &lt;a href="https://research.fb.com/category/augmented-reality-virtual-reality/"&gt;Facebook Reality Labs&lt;/a&gt;, запустили два трека. Оба связаны с VR/AR, Oculus и всем таким. Треки шли в рамках &lt;a href="https://openeyes-workshop.github.io/"&gt;воркшопа к ECCV 2020&lt;/a&gt;.&lt;/p&gt;
&lt;div class="e2-text-picture"&gt;
&lt;img src="https://repushko.com/pictures/099.png" width="640" height="400" alt="" /&gt;
&lt;div class="e2-text-caption"&gt;Один из тысяч кадров&lt;/div&gt;
&lt;/div&gt;
&lt;p&gt;&lt;b&gt;В первом треке&lt;/b&gt; даны последовательности по 100 (трейн) и 55 (валидация) фотографий глаз с gaze-векторами каждого кадра. Представьте, что вы умеет стрелять лазерами из глаз. Вот отнормированный вектор из вашего зрачка до объекта на VR/AR экране и есть gaze-vector.&lt;br /&gt;
Частота записи последовательности — 100Гц. В тесте были те же последовательности по 50 кадров, но уже без настоящих векторов. Общая задача — научиться предсказывать по 50 кадрам последовательности в тесте следующие 5 кадров (т.e. 50мс). Нужно это для &lt;a href="https://en.wikipedia.org/wiki/Foveated_rendering"&gt;foveated rendering&lt;/a&gt;.&lt;/p&gt;
&lt;p&gt;&lt;b&gt;Во втором треке&lt;/b&gt; нужно было сегментировать части глаза (бэкграунд, склеру, радужку и зрачок) по кривой разметке 5% данных в каждой последовательности из 200 кадров. Многие (по отзывам других участников) боролись именно с кривой разметкой, мы же начали решать второй трек за 2 недели до конца и не слишком преуспели, хотя разрыв между топом очень маленький. Важнее и интереснее для нас был именно первый трек.&lt;/p&gt;
&lt;h2&gt;Технические особенности&lt;/h2&gt;
&lt;p&gt;Соревнование проводилось на платформе &lt;a href="https://evalai.cloudcv.org/"&gt;EvalAI&lt;/a&gt;. Там можно скрывать свои сабмиты, но перед этим на какую-то долю секунды они попадают на общую таблицу. Поэтому было решено написать своего бота, который бы мониторил изменения лидерборда, генерировал красивые картинки и присылал их в наш общий диалог. С помощью него мы могли трекать и отслеживать настоящих лидеров, а не те результаты, которые были показаны вручную.&lt;br /&gt;
Был только 1 сабмит в день, каждую ночь предыдущая возможность сабмита сгорала.&lt;/p&gt;
&lt;div class="e2-text-picture"&gt;
&lt;img src="https://repushko.com/pictures/lb.jpg" width="1280" height="897" alt="" /&gt;
&lt;div class="e2-text-caption"&gt;Команда BTSD скрыла свой сабмит&lt;/div&gt;
&lt;/div&gt;
&lt;p&gt;Своего железа у нас было не очень много, поэтому мы время от времени арендовали машины на &lt;a href="https://vast.ai/"&gt;vast.ai&lt;/a&gt;. Потратили на это около 230 долларов за 2 месяца соревнования.&lt;/p&gt;
&lt;h2&gt;Дневник&lt;/h2&gt;
&lt;p&gt;&lt;i&gt;1 июня&lt;/i&gt;&lt;br /&gt;
Создан чат в Телеграме, начали разбираться в предметной области, с платформой, читать правила. Выяснили, как части глаза называются на английском. Создали репозиторий на Гитхабе и настроили всем доступы.&lt;/p&gt;
&lt;div class="e2-text-picture"&gt;
&lt;img src="https://repushko.com/pictures/eye.jpg" width="500" height="239" alt="" /&gt;
&lt;/div&gt;
&lt;p&gt;&lt;i&gt;3 июня&lt;/i&gt;&lt;br /&gt;
Выкачиваются данные, визуально посмотрели gaze-вектора. Появляется идея классическими CV-методами поисков контуров искать зрачок на изображении и смотреть на изменение его положение внутри склеры. Разбираемся в типах движения глаза (саккады, скольжения, статичное положение и т. д.). Наконец-то понимаем вообще в чём суть трека.&lt;/p&gt;
&lt;p&gt;&lt;i&gt;4 июня&lt;/i&gt;&lt;br /&gt;
Нашли &lt;a href="https://pupil-labs.com/"&gt;pupil-labs&lt;/a&gt;, с помощью оборудования которых Facebook генерировал свой датасет. Ничего полезного, но очень интересно.&lt;br /&gt;
Научились находить зрачок обычными CV методами. В итоге это потом использовалось только в визуализациях.&lt;/p&gt;
&lt;div class="e2-text-picture"&gt;
&lt;img src="https://repushko.com/pictures/pupil_center.jpg" width="399" height="133" alt="" /&gt;
&lt;/div&gt;
&lt;p&gt;Пытались добавить ещё всяких контуров, но ничего не получилось.&lt;/p&gt;
&lt;div class="e2-text-picture"&gt;
&lt;img src="https://repushko.com/pictures/countur_orig.jpg" width="640" height="400" alt="" /&gt;
&lt;div class="e2-text-caption"&gt;Оригинальный кадр&lt;/div&gt;
&lt;/div&gt;
&lt;div class="e2-text-picture"&gt;
&lt;img src="https://repushko.com/pictures/countur.jpg" width="657" height="417" alt="" /&gt;
&lt;div class="e2-text-caption"&gt;Посчитанный контур&lt;/div&gt;
&lt;/div&gt;
&lt;p&gt;&lt;b&gt;Важное решение&lt;/b&gt;: посчитали правильным разделить пайплайн на две части: gaze-estimator (модель, которая по кадру предсказывает его gaze-вектор) и gaze-predictor (модель, которая по истории gaze-векторов предсказывает gaze-вектора следующих 5 кадров).&lt;/p&gt;
&lt;p&gt;&lt;i&gt;6 июня&lt;/i&gt;&lt;br /&gt;
Начали визуализировать вектора, чтобы посмотреть на всю последовательность целиком. Нам нужен gaze-predictor, но насколько сложным он будет? Если в данных в основном статичное положение глаза, то тогда сложная модель тут не нужна (так в итоге и оказалось).&lt;/p&gt;
&lt;div class="e2-text-picture"&gt;
&lt;img src="https://repushko.com/pictures/static_gaze.jpg" width="518" height="281" alt="" /&gt;
&lt;div class="e2-text-caption"&gt;Глаз практически неподвижен&lt;/div&gt;
&lt;/div&gt;
&lt;div class="e2-text-picture"&gt;
&lt;img src="https://repushko.com/pictures/saccade.jpg" width="423" height="358" alt="" /&gt;
&lt;div class="e2-text-caption"&gt;А тут уже двигается&lt;/div&gt;
&lt;/div&gt;
&lt;p&gt;Где-то тут было решено для обучения эстиматора (модели, которая будет по кадру предсказывать gaze-вектор) использовать &lt;a href="https://habr.com/ru/company/smartengines/blog/264677/"&gt;аугментации&lt;/a&gt;. Но проблема в том, что при изменении изображения нужно будет менять и изначальный вектор: вращаешь изображение -&gt; вращаешь вектор. Решили патчить &lt;a href="https://github.com/albumentations-team/albumentations"&gt;albumentations&lt;/a&gt;.&lt;/p&gt;
&lt;div class="e2-text-picture"&gt;
&lt;img src="https://repushko.com/pictures/vector_visualize.jpg" width="391" height="251" alt="" /&gt;
&lt;div class="e2-text-caption"&gt;Проекция вектора&lt;/div&gt;
&lt;/div&gt;
&lt;p&gt;&lt;i&gt;11 июня&lt;/i&gt;&lt;br /&gt;
Начали гонять первые модели, оптимизировать параметры. Стали разбираться с предиктором. Попробовали всякие стандартные штуки для форкаста временных рядов типа &lt;a href="https://facebook.github.io/prophet/"&gt;prophet&lt;/a&gt;, но они предсказуемо не зашли из-за специфики данных: нельзя вытащить сезонность (которой нет), другие фичи вроде дней недели, времени и прочего, что активно эксплуатируется в таких местах.&lt;br /&gt;
Обучили первый resnet для эстиматора.&lt;/p&gt;
&lt;p&gt;&lt;i&gt;12 июня&lt;/i&gt;&lt;br /&gt;
Скор первого трека: &lt;b&gt;0.1556&lt;/b&gt;&lt;/p&gt;
&lt;div class="e2-text-picture"&gt;
&lt;img src="https://repushko.com/pictures/submit.jpg" width="949" height="355" alt="" /&gt;
&lt;div class="e2-text-caption"&gt;Сделали первый сабмит (команда baccaddes)&lt;/div&gt;
&lt;/div&gt;
&lt;p&gt;Начали глубже разбираться с метрикой и сравнивать предикты модели с реальными данными, чтобы понять, где косяк. Настроили честную локальную валидацию эстиматора.&lt;/p&gt;
&lt;p&gt;&lt;i&gt;15 июня&lt;/i&gt;&lt;br /&gt;
Скор первого трека: &lt;b&gt; 0.0786&lt;/b&gt;&lt;/p&gt;
&lt;p&gt;Засабмитили улучшенную модель (VAR поверх хорошего эстиматора).&lt;br /&gt;
Это приблизило нас к остальным на ЛБ.&lt;/p&gt;
&lt;p&gt;&lt;i&gt;16 июня&lt;/i&gt;&lt;br /&gt;
Скор первого трека: &lt;b&gt;0.0747&lt;/b&gt;&lt;/p&gt;
&lt;p&gt;Написан и запущен Big Brother — бот, который следит за ЛБ. С этого момента до конца соревнования он работал с одним перебоем на полдня, после без ошибок.&lt;br /&gt;
Засабмитили скользящее среднее по 5 последним кадрам.&lt;/p&gt;
&lt;div class="e2-text-picture"&gt;
&lt;img src="https://repushko.com/pictures/submit_bot.jpg" width="1280" height="708" alt="" /&gt;
&lt;div class="e2-text-caption"&gt;Бот отрабатывает как надо&lt;/div&gt;
&lt;/div&gt;
&lt;p&gt;&lt;i&gt;17 июня&lt;/i&gt;&lt;/p&gt;
&lt;div class="e2-text-picture"&gt;
&lt;img src="https://repushko.com/pictures/ezgif.com-video-to-gif.gif" width="256" height="160" alt="" /&gt;
&lt;div class="e2-text-caption"&gt;Начали смотреть глазами на глаза (это анимация одной последовательности)&lt;/div&gt;
&lt;/div&gt;
&lt;p&gt;Посмотрели на статические генераторы таких данных (NVGaze и UnityEyes). В итоге для сореванования их так и не использовали.&lt;/p&gt;
&lt;p&gt;&lt;i&gt;22 июня&lt;/i&gt;&lt;br /&gt;
Предикт эстиматора очень грязный: колбасит вектора между кадрами и получается, что между ними как будто бы сильное движение глаза.&lt;/p&gt;
&lt;p&gt;&lt;i&gt;28 июня&lt;/i&gt;&lt;br /&gt;
Подумали, что было бы классно научиться группировать авторов одних и тех же последовательностей (количество участников при сборе датасета на порядки меньше числа последовательностей), чтобы вытаскивать оттуда какие-то фичи специфичные для конкретного участника. Эту идею так и не доделали.&lt;/p&gt;
&lt;p&gt;Начали думать про классическое CV снова: хотели вытаскивать крайние точки глаз и прочее.&lt;/p&gt;
&lt;p&gt;Обучили LSTM для предиктора. Сработало чуточку хуже средних по 5 кадрам.&lt;/p&gt;
&lt;p&gt;&lt;i&gt;29 июня&lt;/i&gt;&lt;br /&gt;
Закончили патчить albumentations.&lt;/p&gt;
&lt;div class="e2-text-picture"&gt;
&lt;img src="https://repushko.com/pictures/orig.jpg" width="387" height="251" alt="" /&gt;
&lt;div class="e2-text-caption"&gt;Оригинальный кадр&lt;/div&gt;
&lt;/div&gt;
&lt;div class="e2-text-picture"&gt;
&lt;img src="https://repushko.com/pictures/flipped.jpg" width="385" height="249" alt="" /&gt;
&lt;div class="e2-text-caption"&gt;Сработавший Vertical Flip (и пересчитанный вектор)&lt;/div&gt;
&lt;/div&gt;
&lt;div class="e2-text-picture"&gt;
&lt;img src="https://repushko.com/pictures/shift_scale_rotate.jpg" width="380" height="247" alt="" /&gt;
&lt;div class="e2-text-caption"&gt;Живой ShiftScaleRotate&lt;/div&gt;
&lt;/div&gt;
&lt;p&gt;&lt;i&gt;1 июля&lt;/i&gt;&lt;br /&gt;
Начали подозревать, что в тесте всё таки в основном статика. И что самый большой буст тут даст улучшение эстиматора, а не предиктора.&lt;/p&gt;
&lt;p&gt;Нафигачили для эстиматора аугментаций.&lt;/p&gt;
&lt;p&gt;&lt;i&gt;4 июля&lt;/i&gt;&lt;br /&gt;
Скор первого трека: &lt;b&gt;0.0613&lt;/b&gt;&lt;/p&gt;
&lt;p&gt;Стали думать, как сделать интереснее предиктор. Взяли потыкать &lt;a href="https://github.com/unit8co/darts"&gt;darts&lt;/a&gt; — это такой враппер над всякими стандартными моделями для форкаста.&lt;/p&gt;
&lt;p&gt;Запустили старый метод среднего по кадрам (или какую-то оч простую эвристику) над данными нового эстиматора. Очень сильно улучшились.&lt;/p&gt;
&lt;p&gt;&lt;i&gt;5 июля&lt;/i&gt;&lt;br /&gt;
Скор первого трека: &lt;b&gt;0.0570&lt;/b&gt;&lt;/p&gt;
&lt;p&gt;Выучили пачку effnet’ов (до этого был resnet). Начали дробить на фолды и мешать предикты с разных фолдов.&lt;/p&gt;
&lt;p&gt;Сняли тачку на &lt;a href="https://vast.ai"&gt;vast.ai&lt;/a&gt;.&lt;/p&gt;
&lt;p&gt;Посмотрели на тестовые данные на основе более-менее нормальных предиктов эстиматора. Оказалось, что какая-то динамика в последних 10 кадрах последовательности есть всего в 600-700 последовательностях из 6400.&lt;/p&gt;
&lt;p&gt;Засабмитил старые методы предикта на среднем фолдов effnet’а. Почти до самого конца это было нашим лучшим результатом и первым местом на ЛБ.&lt;/p&gt;
&lt;p&gt;&lt;i&gt;9 июля&lt;/i&gt;&lt;br /&gt;
Обучили mobnet. Стали экспериментировать с предиктором: ExponentialSmoothing, VAR, ARIMA и т. д.&lt;br /&gt;
Методы ничего не докинули, а некоторые и ухудшили скор относительно просто среднего.&lt;br /&gt;
Скор самого предиктора при этом был очень хороший, около 0.000400+ на кадр по их метрике.&lt;/p&gt;
&lt;p&gt;Первый раз открыли данные второго трека, порисовали маски.&lt;/p&gt;
&lt;div class="e2-text-picture"&gt;
&lt;img src="https://repushko.com/pictures/mask.jpg" width="1098" height="1034" alt="" /&gt;
&lt;/div&gt;
&lt;p&gt;&lt;i&gt;10 июля&lt;/i&gt;&lt;br /&gt;
Засабмитили скользящее среднее по 3 кадрам на куче разных фолдов — не сработало.&lt;/p&gt;
&lt;p&gt;Постарались достраивать вектора регрессией. Тоже не сработало.&lt;/p&gt;
&lt;p&gt;&lt;i&gt;11 июля&lt;/i&gt;&lt;br /&gt;
Начали играться с фильтрами над сигналом, чтобы сгладить разницу предиктов эстиматора между соседними кадрами. Получалось хорошо, использовали &lt;a href="https://en.wikipedia.org/wiki/Savitzky%E2%80%93Golay_filter"&gt;фильтр Савицки-Голая&lt;/a&gt;. Кажется, что всякие неровности эстиматора очень красиво сглаживаются.&lt;/p&gt;
&lt;div class="e2-text-picture"&gt;
&lt;img src="https://repushko.com/pictures/savgol_2.jpg" width="751" height="558" alt="" /&gt;
&lt;/div&gt;
&lt;p&gt;&lt;i&gt;12 июля&lt;/i&gt;&lt;br /&gt;
Разбирались с предиктором. Выяснили, что наша регрессия багованная и искали ошибку в разнице валидаций друг у друга. Нашли. Смотрели глазами на фильтрованные предикты и думали, что делать дальше.&lt;/p&gt;
&lt;p&gt;&lt;i&gt;14 июля&lt;/i&gt;&lt;br /&gt;
Нарисовали красивые картинки градиентов по разным осям между двумя соседними кадрами по предиктам на всём тесте. Выяснили, что у нас действительно всё — статика. Поэтому опять же нет смысла во всяких сложных моделях предиктора.&lt;/p&gt;
&lt;div class="e2-text-picture"&gt;
&lt;img src="https://repushko.com/pictures/gradient_x.jpg" width="664" height="422" alt="" /&gt;
&lt;/div&gt;
&lt;p&gt;Выяснили, что локальная метрика эстиматора напрямую коррелирует с результатами на ЛБ и что результат одного хорошего фолда лучше, чем его же со смесью фолдов чуть-чуть хуже. Опять упёрлись в то, что надо дотюнивать эстиматор. Вернулись к resnet’у.&lt;/p&gt;
&lt;p&gt;&lt;i&gt;14 июля — 23 июля&lt;/i&gt;&lt;br /&gt;
Скор первого трека: &lt;b&gt;0.0552&lt;/b&gt;&lt;/p&gt;
&lt;p&gt;Разбирались с сегментацией, удивлялись кривой разметке, сложным случая с закрытыми глазами и т. д.&lt;/p&gt;
&lt;p&gt;Вытюнили 1 фолд для эстиматора до ошибки 0.000197 (в 3 раза лучше прошлых). В предиктор засунули простую эвристику: если статика, то скользящее среднее по 2 последним кадрам, а если была динамика в последних 5 кадрах, то добавляем градиент дальше до упора (из-за особенностей движения глаза, там бОльшая часть движений — линейная).&lt;/p&gt;
&lt;p&gt;&lt;i&gt;23 июля — 29 июля&lt;/i&gt;&lt;br /&gt;
Тюнили и думали над сегментацией. Смотрели на то, как нам применить синтетические данные в сегментаци. Генерировали синтетику.&lt;/p&gt;
&lt;div class="e2-text-picture"&gt;
&lt;img src="https://repushko.com/pictures/unity_eye.jpg" width="1148" height="648" alt="" /&gt;
&lt;div class="e2-text-caption"&gt;Типичный несуществующий глаз&lt;/div&gt;
&lt;/div&gt;
&lt;p&gt;Из интересного: один сабмит пропустили, потому что кое-кто заснул от усталости и не слышал звонков с просьбой прислать данные. Два сабмита в два дня были сделаны за 30 и 20 секунд до сгорания.&lt;/p&gt;
&lt;div class="e2-text-picture"&gt;
&lt;img src="https://repushko.com/pictures/sega.png" width="720" height="720" alt="" /&gt;
&lt;div class="e2-text-caption"&gt;Кусочек каких-то сравнений моделей по сегментации&lt;/div&gt;
&lt;/div&gt;
&lt;p&gt;&lt;i&gt;30 июля — 31 июля&lt;/i&gt;&lt;br /&gt;
Скор первого трека: &lt;b&gt;0.0537&lt;/b&gt;&lt;/p&gt;
&lt;p&gt;Смотрели и думали над всякими сложными случаями в сегментации&lt;/p&gt;
&lt;div class="e2-text-picture"&gt;
&lt;img src="https://repushko.com/pictures/sega2.jpg" width="1280" height="287" alt="" /&gt;
&lt;/div&gt;
&lt;div class="e2-text-picture"&gt;
&lt;img src="https://repushko.com/pictures/sega3.jpg" width="1280" height="277" alt="" /&gt;
&lt;/div&gt;
&lt;p&gt;По первому треку доучили остальные бленды эстиматора, сблендили и засабмитили. Так и осталось нашим лучшим результатом.&lt;/p&gt;
&lt;p&gt;По сегментации остались на 8ом месте.&lt;/p&gt;
&lt;h2&gt;Что хотели попробовать, но не попробовали&lt;/h2&gt;
&lt;ul&gt;
&lt;li&gt;Не использовали никакую синтетику, а скорее всгео надо было бы. Можно и в обоих треках&lt;/li&gt;
&lt;li&gt;Надо было учить LSTM на чистых данных (в том числе из теста и из трейна) и сразу на векторах. Наши эвристики в итоге были по каждой оси отдельно&lt;/li&gt;
&lt;/ul&gt;
</description>
</item>

<item>
<title>«Средненько». Проверка гипотезы</title>
<guid isPermaLink="false">41</guid>
<link>https://repushko.com/all/srednenko-poc/</link>
<pubDate>Sun, 26 Apr 2020 01:05:52 +0300</pubDate>
<author>Антон Репушко</author>
<comments>https://repushko.com/all/srednenko-poc/</comments>
<description>
&lt;h2&gt;Мотивация&lt;/h2&gt;
&lt;p&gt;Я 3-4 года назад услышал про исследование &lt;a href="https://strelka-kb.com/"&gt;КБ «Стрелка»&lt;/a&gt;, в котором они скрапили фото из социальных сетей (Инстаграм и ВК) и рисовали хитмапы на картах по ним. Оказывается, это называется &lt;a href="https://strelkamag.com/ru/article/est-takaya-professiya-cifrovoi-antropolog"&gt;цифровой антропологией&lt;/a&gt;.&lt;/p&gt;
&lt;p&gt;Идея кейса, который вдохновил меня, в том, что такое исследование помогло в каком-то там городе РФ выбрать лучшую точку для открытия общественного пространства. Гипотеза такая: если люди где-то делают фото, значит уже проводят там время, а значит там и так всё хорошо с социальной жизнью. В итоге администрации посоветовали открыть новую точку интереса на противоположном конце города от существующей.&lt;/p&gt;
&lt;p&gt;Загорелся идеей сделать нечто похожее, но в сферу каких-то постоянных событий идея оставалась идеей без реализации.&lt;/p&gt;
&lt;p&gt;Закрывая гештальт (как Инстаграм своё API для доступа к гео-информации о фотографиях в 2016-ом) достиг успеха.&lt;/p&gt;
&lt;h2&gt;Реализация&lt;/h2&gt;
&lt;p&gt;Т. к. API Инстаграма оказалось закрытым, решил воспользоваться &lt;a href="https://www.flickr.com/"&gt;Flickr’ом&lt;/a&gt;.&lt;br /&gt;
Суть идеи:&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;берем 2019ый год,&lt;/li&gt;
&lt;li&gt;cкрапим фотографии с Flickr для конкретной локации (т.e. города),&lt;/li&gt;
&lt;li&gt;аккуратно накладываем на карту,&lt;/li&gt;
&lt;li&gt;видим места, где люди много фотографируют,&lt;/li&gt;
&lt;li&gt;делаем какие-то выводы.&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;&lt;b&gt;Например&lt;/b&gt;: люди фотографируют -&gt; там что-то интересное -&gt; логично поселиться во время поездки.&lt;/p&gt;
&lt;p&gt;&lt;b&gt;Другой например&lt;/b&gt;: можно увидеть места, которые недостаточно освещены туристически (с точки зрения наличия фотографий) и можно выбрать наоборот район, где живут местные. На примере Берлина эта теория вроде как работает.&lt;/p&gt;
&lt;div class="e2-text-picture"&gt;
&lt;img src="https://repushko.com/pictures/berlin_flickr_project_2019.jpg" width="1280" height="684" alt="" /&gt;
&lt;div class="e2-text-caption"&gt;Фотографии в Берлине за 2019ый год&lt;/div&gt;
&lt;/div&gt;
&lt;p&gt;Найденные подводные камни:&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;API Flickr’a частично не завелось из python-обертки, которую я нашёл,&lt;/li&gt;
&lt;li&gt;фотографий не так много (250к за год), как в Инстаграме. С геопозицией — еще меньше. За 2019ый год только 44к для Берлина,&lt;/li&gt;
&lt;li&gt;на карте прямыми линиями из фотографий заметны фотопрогулки, когда один человек шел и фотографировал всё, что видел. Так получается много фотографий одного места, хотя это всего лишь от одного человека. В планах написать кастомную функцию хитмапа, которая бы давала больший вес участкам, где фотографии от разных людей. Так получится сильно честнее.&lt;/li&gt;
&lt;/ul&gt;
&lt;h2&gt;«Средненько»&lt;/h2&gt;
&lt;p&gt;В процессе возникла идея — сопоставить кучу фотографий одной достопримечательности для получения её «усреднённого» вида. Итог получился сильно лучше, чем я ожидал.&lt;/p&gt;
&lt;div class="e2-text-picture"&gt;
&lt;img src="https://repushko.com/pictures/ansgar-scheffold-cyUf9E_mhFc-unsplash.jpg" width="2560" height="1701" alt="" /&gt;
&lt;div class="e2-text-caption"&gt;Оригинальные Бранденбургские ворота&lt;/div&gt;
&lt;/div&gt;
&lt;div class="e2-text-picture"&gt;
&lt;img src="https://repushko.com/pictures/average_brandenburg_gates.jpg" width="1280" height="774" alt="" /&gt;
&lt;div class="e2-text-caption"&gt;Усреднённые 55 фотографий Бранденбургских ворот&lt;/div&gt;
&lt;/div&gt;
&lt;p&gt;Когда-то вероятно продолжу и сделаю для других городов.&lt;/p&gt;
</description>
</item>

<item>
<title>Баркоды сериала «Tales from the Loop»</title>
<guid isPermaLink="false">37</guid>
<link>https://repushko.com/all/barkody-seriala-tales-from-the-loop/</link>
<pubDate>Tue, 21 Apr 2020 15:24:26 +0300</pubDate>
<author>Антон Репушко</author>
<comments>https://repushko.com/all/barkody-seriala-tales-from-the-loop/</comments>
<description>
&lt;p&gt;Сделал баркоды, как и с &lt;a href="https://repushko.com/all/barkody-seriala-chernobyl/"&gt;сериалом «Чернобыль»&lt;/a&gt;. Каждая полоса — средний цвет кадра в этот момент времени.&lt;/p&gt;
&lt;div class="e2-text-picture"&gt;
&lt;img src="https://repushko.com/pictures/S1E1.jpg" width="1700" height="400" alt="" /&gt;
&lt;div class="e2-text-caption"&gt;«Loop»&lt;/div&gt;
&lt;/div&gt;
&lt;div class="e2-text-picture"&gt;
&lt;img src="https://repushko.com/pictures/S1E2.jpg" width="1700" height="400" alt="" /&gt;
&lt;div class="e2-text-caption"&gt;«Transpose»&lt;/div&gt;
&lt;/div&gt;
&lt;div class="e2-text-picture"&gt;
&lt;img src="https://repushko.com/pictures/S1E3.jpg" width="1700" height="400" alt="" /&gt;
&lt;div class="e2-text-caption"&gt;«Stasis»&lt;/div&gt;
&lt;/div&gt;
&lt;div class="e2-text-picture"&gt;
&lt;img src="https://repushko.com/pictures/S1E4.jpg" width="1700" height="400" alt="" /&gt;
&lt;div class="e2-text-caption"&gt;«Echo Sphere»&lt;/div&gt;
&lt;/div&gt;
&lt;div class="e2-text-picture"&gt;
&lt;img src="https://repushko.com/pictures/S1E5.jpg" width="1700" height="400" alt="" /&gt;
&lt;div class="e2-text-caption"&gt;«Control»&lt;/div&gt;
&lt;/div&gt;
&lt;div class="e2-text-picture"&gt;
&lt;img src="https://repushko.com/pictures/S1E6.jpg" width="1700" height="400" alt="" /&gt;
&lt;div class="e2-text-caption"&gt;«Parallel»&lt;/div&gt;
&lt;/div&gt;
&lt;div class="e2-text-picture"&gt;
&lt;img src="https://repushko.com/pictures/S1E7.jpg" width="1700" height="400" alt="" /&gt;
&lt;div class="e2-text-caption"&gt;«Enemies»&lt;/div&gt;
&lt;/div&gt;
&lt;div class="e2-text-picture"&gt;
&lt;img src="https://repushko.com/pictures/S1E8.jpg" width="1700" height="400" alt="" /&gt;
&lt;div class="e2-text-caption"&gt;«Home»&lt;/div&gt;
&lt;/div&gt;
</description>
</item>

<item>
<title>Особенности pip и потенциальная дырка</title>
<guid isPermaLink="false">18</guid>
<link>https://repushko.com/all/osobennosti-pip/</link>
<pubDate>Mon, 23 Sep 2019 13:32:58 +0300</pubDate>
<author>Антон Репушко</author>
<comments>https://repushko.com/all/osobennosti-pip/</comments>
<description>
&lt;p&gt;Не вдаваясь конкретно в библиотеки (это два клиента для &lt;i&gt;keycloak&lt;/i&gt;), расскажу о ситуации.&lt;/p&gt;
&lt;p&gt;Есть библиотека &lt;b&gt;А&lt;/b&gt; и библиотека &lt;b&gt;B&lt;/b&gt;. Библиотеки &lt;b&gt;А&lt;/b&gt; и &lt;b&gt; B&lt;/b&gt; обе зарегистрированы в &lt;i&gt;pypi&lt;/i&gt; под разными именами. Но в &lt;i&gt;setup.py&lt;/i&gt; обе экспортируют одинаковые по имени пакеты (параметр &lt;i&gt;packages&lt;/i&gt;), которые и буду в итоге отображены в вашем списке пакетов. Как вы думаете, как поступит &lt;i&gt;pip&lt;/i&gt;, если указать ему обе библиотеки в зависимостях проекта?&lt;/p&gt;
&lt;p&gt;... минутка на подумать ...&lt;/p&gt;
&lt;p&gt;Он их смёржит между собой. При этом будет устанавливать одну библиотеку поверх другой, в порядке как в списке зависимостей. Я не нашёл ни в документации ни где-то ещё описания такого поведения. А оно приводит например к следующему:&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;у вас в списке зависимостей библиотека &lt;b&gt;A&lt;/b&gt; идёт перед библиотекой &lt;b&gt;B&lt;/b&gt;,&lt;/li&gt;
&lt;li&gt;и там и там есть файл &lt;i&gt;exceptions.py&lt;/i&gt;, в котором прописаны исключения,&lt;/li&gt;
&lt;li&gt;после установки библиотеки &lt;b&gt;B&lt;/b&gt;, файл &lt;i&gt;exceptions.py&lt;/i&gt; будет из библиотеки &lt;b&gt;B&lt;/b&gt;, при этом уникальные для библиотеки &lt;b&gt;А&lt;/b&gt; файлы так и останутся на месте и в импортах будет использоваться &lt;i&gt;exceptions.py&lt;/i&gt;, который уже от другой библиотеки,&lt;/li&gt;
&lt;li&gt;как минимум это приводит к конфликтам, ошибкам и дебагу.&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;Ещё интересным выглядит вектор раскручивания этого до уязвимости: а что, если мы в нашей библиотеке (или в зависимостях нашей библиотеки) пропишем какое-то популярное имя пакета (например &lt;i&gt;Flask&lt;/i&gt;) и переопределим поведение? Т.e. любой, кто установит нашу библиотеку не глядя на то, что внутри, имеет шанс запустить у себя наш код не подозревая об этом. Достаточно просто нашу библиотеку в списке зависимостей разместить ниже фреймворка, в который мы лезем.&lt;/p&gt;
&lt;p&gt;Мем конечно смешной, а ситуация страшная.&lt;/p&gt;
&lt;p&gt;Решил сходить и спросить у знающих людей, как так можно жить. &lt;a href="https://orsinium.dev"&gt;Никита Воронов&lt;/a&gt; делает &lt;a href="https://github.com/dephell/dephell"&gt;dephell&lt;/a&gt; и рассказал, что это не баг, а фича.&lt;/p&gt;
&lt;blockquote&gt;
&lt;p&gt;Так можно делать отдельные пакеты с плагинами, которые положат себя в папку &lt;i&gt;plugins&lt;/i&gt;. Причём много кто  это делает, так что поведение уже поздно менять. Про опасность пакетов вообще бесполезно говорить. Уже при установке пакет может в &lt;i&gt;setup.py&lt;/i&gt; что угодно сделать. Например, слить твой ssh ключ. Так что недоверенные пакеты устанавливать вообще нельзя. Можно &lt;a href="https://pages.charlesreid1.com/dont-sudo-pip/"&gt;почитать&lt;/a&gt;, почему никогда нельзя звать&lt;i&gt; sudo pip install&lt;/i&gt;. Проблема в том, что альтернатив нет, а все другие пакетные менеджеры (в том числе и &lt;i&gt;dephell&lt;/i&gt;) всё равно внутри зовут &lt;i&gt;pip&lt;/i&gt;.&lt;/p&gt;
&lt;/blockquote&gt;
&lt;p&gt;Всё это грустно. Ну и надо думать над тем, как называть пакеты и смотреть, есть ли кто-то уже с таким же именем в &lt;i&gt;pypi&lt;/i&gt;. Для решения моего конфликта оказалось проще руками затащить часть одной из либ в проект. Другой найденный вариант — использовать &lt;i&gt;install-options pip’a&lt;/i&gt; и &lt;i&gt;prefix&lt;/i&gt; для задания кастомного пути одной из либ.&lt;/p&gt;
&lt;p&gt;Ну и конечно устанавливайте только доверенные пакеты.&lt;/p&gt;
</description>
</item>

<item>
<title>Баркоды сериала «Чернобыль»</title>
<guid isPermaLink="false">15</guid>
<link>https://repushko.com/all/barkody-seriala-chernobyl/</link>
<pubDate>Tue, 18 Jun 2019 22:22:22 +0300</pubDate>
<author>Антон Репушко</author>
<comments>https://repushko.com/all/barkody-seriala-chernobyl/</comments>
<description>
&lt;p&gt;Вспомнил про идею &lt;a href="https://moviebarcode.tumblr.com/"&gt;moviebarcode&lt;/a&gt; и сделал тоже самое для сериала «Чернобыль» от HBO.&lt;br /&gt;
Для каждого кадра серии посчитал средний цвет и выстроил по таймлайну. Сделал всё через OpenCV и Python.&lt;br /&gt;
Получилась такая красота:&lt;/p&gt;
&lt;div class="e2-text-picture"&gt;
&lt;img src="https://repushko.com/pictures/chernobyl_1_resized.jpg" width="1693" height="400" alt="" /&gt;
&lt;div class="e2-text-caption"&gt;1:23:45&lt;/div&gt;
&lt;/div&gt;
&lt;div class="e2-text-picture"&gt;
&lt;img src="https://repushko.com/pictures/chernobyl_2_resized.jpg" width="1867" height="400" alt="" /&gt;
&lt;div class="e2-text-caption"&gt;Пожалуйста, сохраняйте спокойствие&lt;/div&gt;
&lt;/div&gt;
&lt;div class="e2-text-picture"&gt;
&lt;img src="https://repushko.com/pictures/chernobyl_3_resized.jpg" width="1776" height="400" alt="" /&gt;
&lt;div class="e2-text-caption"&gt;Откройся широко, о Земля!&lt;/div&gt;
&lt;/div&gt;
&lt;div class="e2-text-picture"&gt;
&lt;img src="https://repushko.com/pictures/chernobyl_4_resized.jpg" width="1868" height="400" alt="" /&gt;
&lt;div class="e2-text-caption"&gt;Счастье всего человечества&lt;/div&gt;
&lt;/div&gt;
&lt;div class="e2-text-picture"&gt;
&lt;img src="https://repushko.com/pictures/chernobyl_5_resized.jpg" width="2057" height="400" alt="" /&gt;
&lt;div class="e2-text-caption"&gt;Вечная память&lt;/div&gt;
&lt;/div&gt;
</description>
</item>

<item>
<title>Запятые и таплы</title>
<guid isPermaLink="false">7</guid>
<link>https://repushko.com/all/zapyatye-i-taply/</link>
<pubDate>Thu, 14 Feb 2019 01:06:45 +0300</pubDate>
<author>Антон Репушко</author>
<comments>https://repushko.com/all/zapyatye-i-taply/</comments>
<description>
&lt;p&gt;Долго искал классическую и глупую ошибку. Обстановка такая:&lt;/p&gt;
&lt;pre class="e2-text-code"&gt;&lt;code class=""&gt;class TestView(View):
    def __init__(self, storage_arg: Storage):
        self.storage = storage_arg,
        ...

    def get_item_name(id):
        ...
        return self.storage.name(id)&lt;/code&gt;&lt;/pre&gt;&lt;p&gt;&lt;i&gt;self.storage&lt;/i&gt; внезапно оказывается &lt;i&gt;tuple&amp;lt;Storage&gt;&lt;/i&gt;, хотя &lt;i&gt;storage_arg&lt;/i&gt; типа &lt;i&gt;Storage&lt;/i&gt;.&lt;/p&gt;
&lt;p&gt;Легко догадаться, что проблема в лишней запятой после &lt;i&gt;storage_arg&lt;/i&gt;. В питоне код &lt;i&gt;1,&lt;/i&gt; создаст тапл из одного элемента.&lt;/p&gt;
&lt;p&gt;Установил &lt;a href="https://pypi.org/project/flake8-commas/"&gt;расширение для flake8&lt;/a&gt;, чтобы больше на таком не попадаться.&lt;/p&gt;
</description>
</item>

<item>
<title>Скрипты для очистки данных со stat.gibdd.ru</title>
<guid isPermaLink="false">4</guid>
<link>https://repushko.com/all/dtp-stat-helpers/</link>
<pubDate>Mon, 04 Feb 2019 15:16:09 +0300</pubDate>
<author>Антон Репушко</author>
<comments>https://repushko.com/all/dtp-stat-helpers/</comments>
<description>
&lt;p&gt;Написал &lt;a href="https://github.com/repushko/dtp_stat_helpers"&gt;пару скриптов&lt;/a&gt; для исправления координат ДТП.&lt;/p&gt;
&lt;p&gt;Процесс состоит из двух шагов:&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;привязка координат ДТП к адресу (он обычно заполняется правильно),&lt;/li&gt;
&lt;li&gt;проекция координат адреса на ближайшую улицу. Скрипт может не работать в России без VPN.&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;Не вынес отдельно конфигурацию, поэтому лучше всё запускать по шагам у себя в тетрадках и настраивать под себя.&lt;/p&gt;
</description>
</item>


</channel>
</rss>