{
    "version": "https:\/\/jsonfeed.org\/version\/1",
    "title": "Блог Антона Репушко: заметки с тегом питон",
    "_rss_description": "Блог Антона Репушко",
    "_rss_language": "ru",
    "_itunes_email": "",
    "_itunes_categories_xml": "",
    "_itunes_image": "",
    "_itunes_explicit": "",
    "home_page_url": "https:\/\/repushko.com\/tags\/piton\/",
    "feed_url": "https:\/\/repushko.com\/tags\/piton\/json\/",
    "icon": "https:\/\/repushko.com\/user\/userpic@2x.jpg?1608852798",
    "author": {
        "name": "Антон Репушко",
        "url": "https:\/\/repushko.com\/",
        "avatar": "https:\/\/repushko.com\/user\/userpic@2x.jpg?1608852798"
    },
    "items": [
        {
            "id": "49",
            "url": "https:\/\/repushko.com\/all\/openeds2020\/",
            "title": "Дневник соревнования OpenEDS 2020",
            "content_html": "<p>Мы со <a href=\"https:\/\/www.linkedin.com\/in\/sviatoslav-skoblov\">Святославом Скобловым<\/a> 2 месяца решали <a href=\"https:\/\/research.fb.com\/programs\/openeds-2020-challenge\/\">OpenEDS 2020 Challenge<\/a>, где в одном треке заняли первое место, а во втором восьмое. Про второй трек тут не будет, потому что он скучный и не очень интересный. И ещё нас изредка консультировал Вова Михеюшкин по всяким CV-вопросам. Может быть кому-то тоже будет интересно почитать, как проходят соревнования по ML.<\/p>\n<h2>Про соревнование<\/h2>\n<p>На основе <a href=\"https:\/\/arxiv.org\/abs\/2005.03876\">датасета OpenEDS2020<\/a>, собранного <a href=\"https:\/\/research.fb.com\/category\/augmented-reality-virtual-reality\/\">Facebook Reality Labs<\/a>, запустили два трека. Оба связаны с VR\/AR, Oculus и всем таким. Треки шли в рамках <a href=\"https:\/\/openeyes-workshop.github.io\/\">воркшопа к ECCV 2020<\/a>.<\/p>\n<div class=\"e2-text-picture\">\n<img src=\"https:\/\/repushko.com\/pictures\/099.png\" width=\"640\" height=\"400\" alt=\"\" \/>\n<div class=\"e2-text-caption\">Один из тысяч кадров<\/div>\n<\/div>\n<p><b>В первом треке<\/b> даны последовательности по 100 (трейн) и 55 (валидация) фотографий глаз с gaze-векторами каждого кадра. Представьте, что вы умеет стрелять лазерами из глаз. Вот отнормированный вектор из вашего зрачка до объекта на VR\/AR экране и есть gaze-vector.<br \/>\nЧастота записи последовательности — 100Гц. В тесте были те же последовательности по 50 кадров, но уже без настоящих векторов. Общая задача — научиться предсказывать по 50 кадрам последовательности в тесте следующие 5 кадров (т.e. 50мс). Нужно это для <a href=\"https:\/\/en.wikipedia.org\/wiki\/Foveated_rendering\">foveated rendering<\/a>.<\/p>\n<p><b>Во втором треке<\/b> нужно было сегментировать части глаза (бэкграунд, склеру, радужку и зрачок) по кривой разметке 5% данных в каждой последовательности из 200 кадров. Многие (по отзывам других участников) боролись именно с кривой разметкой, мы же начали решать второй трек за 2 недели до конца и не слишком преуспели, хотя разрыв между топом очень маленький. Важнее и интереснее для нас был именно первый трек.<\/p>\n<h2>Технические особенности<\/h2>\n<p>Соревнование проводилось на платформе <a href=\"https:\/\/evalai.cloudcv.org\/\">EvalAI<\/a>. Там можно скрывать свои сабмиты, но перед этим на какую-то долю секунды они попадают на общую таблицу. Поэтому было решено написать своего бота, который бы мониторил изменения лидерборда, генерировал красивые картинки и присылал их в наш общий диалог. С помощью него мы могли трекать и отслеживать настоящих лидеров, а не те результаты, которые были показаны вручную.<br \/>\nБыл только 1 сабмит в день, каждую ночь предыдущая возможность сабмита сгорала.<\/p>\n<div class=\"e2-text-picture\">\n<img src=\"https:\/\/repushko.com\/pictures\/lb.jpg\" width=\"1280\" height=\"897\" alt=\"\" \/>\n<div class=\"e2-text-caption\">Команда BTSD скрыла свой сабмит<\/div>\n<\/div>\n<p>Своего железа у нас было не очень много, поэтому мы время от времени арендовали машины на <a href=\"https:\/\/vast.ai\/\">vast.ai<\/a>. Потратили на это около 230 долларов за 2 месяца соревнования.<\/p>\n<h2>Дневник<\/h2>\n<p><i>1 июня<\/i><br \/>\nСоздан чат в Телеграме, начали разбираться в предметной области, с платформой, читать правила. Выяснили, как части глаза называются на английском. Создали репозиторий на Гитхабе и настроили всем доступы.<\/p>\n<div class=\"e2-text-picture\">\n<img src=\"https:\/\/repushko.com\/pictures\/eye.jpg\" width=\"500\" height=\"239\" alt=\"\" \/>\n<\/div>\n<p><i>3 июня<\/i><br \/>\nВыкачиваются данные, визуально посмотрели gaze-вектора. Появляется идея классическими CV-методами поисков контуров искать зрачок на изображении и смотреть на изменение его положение внутри склеры. Разбираемся в типах движения глаза (саккады, скольжения, статичное положение и т. д.). Наконец-то понимаем вообще в чём суть трека.<\/p>\n<p><i>4 июня<\/i><br \/>\nНашли <a href=\"https:\/\/pupil-labs.com\/\">pupil-labs<\/a>, с помощью оборудования которых Facebook генерировал свой датасет. Ничего полезного, но очень интересно.<br \/>\nНаучились находить зрачок обычными CV методами. В итоге это потом использовалось только в визуализациях.<\/p>\n<div class=\"e2-text-picture\">\n<img src=\"https:\/\/repushko.com\/pictures\/pupil_center.jpg\" width=\"399\" height=\"133\" alt=\"\" \/>\n<\/div>\n<p>Пытались добавить ещё всяких контуров, но ничего не получилось.<\/p>\n<div class=\"e2-text-picture\">\n<img src=\"https:\/\/repushko.com\/pictures\/countur_orig.jpg\" width=\"640\" height=\"400\" alt=\"\" \/>\n<div class=\"e2-text-caption\">Оригинальный кадр<\/div>\n<\/div>\n<div class=\"e2-text-picture\">\n<img src=\"https:\/\/repushko.com\/pictures\/countur.jpg\" width=\"657\" height=\"417\" alt=\"\" \/>\n<div class=\"e2-text-caption\">Посчитанный контур<\/div>\n<\/div>\n<p><b>Важное решение<\/b>: посчитали правильным разделить пайплайн на две части: gaze-estimator (модель, которая по кадру предсказывает его gaze-вектор) и gaze-predictor (модель, которая по истории gaze-векторов предсказывает gaze-вектора следующих 5 кадров).<\/p>\n<p><i>6 июня<\/i><br \/>\nНачали визуализировать вектора, чтобы посмотреть на всю последовательность целиком. Нам нужен gaze-predictor, но насколько сложным он будет? Если в данных в основном статичное положение глаза, то тогда сложная модель тут не нужна (так в итоге и оказалось).<\/p>\n<div class=\"e2-text-picture\">\n<img src=\"https:\/\/repushko.com\/pictures\/static_gaze.jpg\" width=\"518\" height=\"281\" alt=\"\" \/>\n<div class=\"e2-text-caption\">Глаз практически неподвижен<\/div>\n<\/div>\n<div class=\"e2-text-picture\">\n<img src=\"https:\/\/repushko.com\/pictures\/saccade.jpg\" width=\"423\" height=\"358\" alt=\"\" \/>\n<div class=\"e2-text-caption\">А тут уже двигается<\/div>\n<\/div>\n<p>Где-то тут было решено для обучения эстиматора (модели, которая будет по кадру предсказывать gaze-вектор) использовать <a href=\"https:\/\/habr.com\/ru\/company\/smartengines\/blog\/264677\/\">аугментации<\/a>. Но проблема в том, что при изменении изображения нужно будет менять и изначальный вектор: вращаешь изображение -> вращаешь вектор. Решили патчить <a href=\"https:\/\/github.com\/albumentations-team\/albumentations\">albumentations<\/a>.<\/p>\n<div class=\"e2-text-picture\">\n<img src=\"https:\/\/repushko.com\/pictures\/vector_visualize.jpg\" width=\"391\" height=\"251\" alt=\"\" \/>\n<div class=\"e2-text-caption\">Проекция вектора<\/div>\n<\/div>\n<p><i>11 июня<\/i><br \/>\nНачали гонять первые модели, оптимизировать параметры. Стали разбираться с предиктором. Попробовали всякие стандартные штуки для форкаста временных рядов типа <a href=\"https:\/\/facebook.github.io\/prophet\/\">prophet<\/a>, но они предсказуемо не зашли из-за специфики данных: нельзя вытащить сезонность (которой нет), другие фичи вроде дней недели, времени и прочего, что активно эксплуатируется в таких местах.<br \/>\nОбучили первый resnet для эстиматора.<\/p>\n<p><i>12 июня<\/i><br \/>\nСкор первого трека: <b>0.1556<\/b><\/p>\n<div class=\"e2-text-picture\">\n<img src=\"https:\/\/repushko.com\/pictures\/submit.jpg\" width=\"949\" height=\"355\" alt=\"\" \/>\n<div class=\"e2-text-caption\">Сделали первый сабмит (команда baccaddes)<\/div>\n<\/div>\n<p>Начали глубже разбираться с метрикой и сравнивать предикты модели с реальными данными, чтобы понять, где косяк. Настроили честную локальную валидацию эстиматора.<\/p>\n<p><i>15 июня<\/i><br \/>\nСкор первого трека: <b> 0.0786<\/b><\/p>\n<p>Засабмитили улучшенную модель (VAR поверх хорошего эстиматора).<br \/>\nЭто приблизило нас к остальным на ЛБ.<\/p>\n<p><i>16 июня<\/i><br \/>\nСкор первого трека: <b>0.0747<\/b><\/p>\n<p>Написан и запущен Big Brother — бот, который следит за ЛБ. С этого момента до конца соревнования он работал с одним перебоем на полдня, после без ошибок.<br \/>\nЗасабмитили скользящее среднее по 5 последним кадрам.<\/p>\n<div class=\"e2-text-picture\">\n<img src=\"https:\/\/repushko.com\/pictures\/submit_bot.jpg\" width=\"1280\" height=\"708\" alt=\"\" \/>\n<div class=\"e2-text-caption\">Бот отрабатывает как надо<\/div>\n<\/div>\n<p><i>17 июня<\/i><\/p>\n<div class=\"e2-text-picture\">\n<img src=\"https:\/\/repushko.com\/pictures\/ezgif.com-video-to-gif.gif\" width=\"256\" height=\"160\" alt=\"\" \/>\n<div class=\"e2-text-caption\">Начали смотреть глазами на глаза (это анимация одной последовательности)<\/div>\n<\/div>\n<p>Посмотрели на статические генераторы таких данных (NVGaze и UnityEyes). В итоге для сореванования их так и не использовали.<\/p>\n<p><i>22 июня<\/i><br \/>\nПредикт эстиматора очень грязный: колбасит вектора между кадрами и получается, что между ними как будто бы сильное движение глаза.<\/p>\n<p><i>28 июня<\/i><br \/>\nПодумали, что было бы классно научиться группировать авторов одних и тех же последовательностей (количество участников при сборе датасета на порядки меньше числа последовательностей), чтобы вытаскивать оттуда какие-то фичи специфичные для конкретного участника. Эту идею так и не доделали.<\/p>\n<p>Начали думать про классическое CV снова: хотели вытаскивать крайние точки глаз и прочее.<\/p>\n<p>Обучили LSTM для предиктора. Сработало чуточку хуже средних по 5 кадрам.<\/p>\n<p><i>29 июня<\/i><br \/>\nЗакончили патчить albumentations.<\/p>\n<div class=\"e2-text-picture\">\n<img src=\"https:\/\/repushko.com\/pictures\/orig.jpg\" width=\"387\" height=\"251\" alt=\"\" \/>\n<div class=\"e2-text-caption\">Оригинальный кадр<\/div>\n<\/div>\n<div class=\"e2-text-picture\">\n<img src=\"https:\/\/repushko.com\/pictures\/flipped.jpg\" width=\"385\" height=\"249\" alt=\"\" \/>\n<div class=\"e2-text-caption\">Сработавший Vertical Flip (и пересчитанный вектор)<\/div>\n<\/div>\n<div class=\"e2-text-picture\">\n<img src=\"https:\/\/repushko.com\/pictures\/shift_scale_rotate.jpg\" width=\"380\" height=\"247\" alt=\"\" \/>\n<div class=\"e2-text-caption\">Живой ShiftScaleRotate<\/div>\n<\/div>\n<p><i>1 июля<\/i><br \/>\nНачали подозревать, что в тесте всё таки в основном статика. И что самый большой буст тут даст улучшение эстиматора, а не предиктора.<\/p>\n<p>Нафигачили для эстиматора аугментаций.<\/p>\n<p><i>4 июля<\/i><br \/>\nСкор первого трека: <b>0.0613<\/b><\/p>\n<p>Стали думать, как сделать интереснее предиктор. Взяли потыкать <a href=\"https:\/\/github.com\/unit8co\/darts\">darts<\/a> — это такой враппер над всякими стандартными моделями для форкаста.<\/p>\n<p>Запустили старый метод среднего по кадрам (или какую-то оч простую эвристику) над данными нового эстиматора. Очень сильно улучшились.<\/p>\n<p><i>5 июля<\/i><br \/>\nСкор первого трека: <b>0.0570<\/b><\/p>\n<p>Выучили пачку effnet’ов (до этого был resnet). Начали дробить на фолды и мешать предикты с разных фолдов.<\/p>\n<p>Сняли тачку на <a href=\"https:\/\/vast.ai\">vast.ai<\/a>.<\/p>\n<p>Посмотрели на тестовые данные на основе более-менее нормальных предиктов эстиматора. Оказалось, что какая-то динамика в последних 10 кадрах последовательности есть всего в 600-700 последовательностях из 6400.<\/p>\n<p>Засабмитил старые методы предикта на среднем фолдов effnet’а. Почти до самого конца это было нашим лучшим результатом и первым местом на ЛБ.<\/p>\n<p><i>9 июля<\/i><br \/>\nОбучили mobnet. Стали экспериментировать с предиктором: ExponentialSmoothing, VAR, ARIMA и т. д.<br \/>\nМетоды ничего не докинули, а некоторые и ухудшили скор относительно просто среднего.<br \/>\nСкор самого предиктора при этом был очень хороший, около 0.000400+ на кадр по их метрике.<\/p>\n<p>Первый раз открыли данные второго трека, порисовали маски.<\/p>\n<div class=\"e2-text-picture\">\n<img src=\"https:\/\/repushko.com\/pictures\/mask.jpg\" width=\"1098\" height=\"1034\" alt=\"\" \/>\n<\/div>\n<p><i>10 июля<\/i><br \/>\nЗасабмитили скользящее среднее по 3 кадрам на куче разных фолдов — не сработало.<\/p>\n<p>Постарались достраивать вектора регрессией. Тоже не сработало.<\/p>\n<p><i>11 июля<\/i><br \/>\nНачали играться с фильтрами над сигналом, чтобы сгладить разницу предиктов эстиматора между соседними кадрами. Получалось хорошо, использовали <a href=\"https:\/\/en.wikipedia.org\/wiki\/Savitzky%E2%80%93Golay_filter\">фильтр Савицки-Голая<\/a>. Кажется, что всякие неровности эстиматора очень красиво сглаживаются.<\/p>\n<div class=\"e2-text-picture\">\n<img src=\"https:\/\/repushko.com\/pictures\/savgol_2.jpg\" width=\"751\" height=\"558\" alt=\"\" \/>\n<\/div>\n<p><i>12 июля<\/i><br \/>\nРазбирались с предиктором. Выяснили, что наша регрессия багованная и искали ошибку в разнице валидаций друг у друга. Нашли. Смотрели глазами на фильтрованные предикты и думали, что делать дальше.<\/p>\n<p><i>14 июля<\/i><br \/>\nНарисовали красивые картинки градиентов по разным осям между двумя соседними кадрами по предиктам на всём тесте. Выяснили, что у нас действительно всё — статика. Поэтому опять же нет смысла во всяких сложных моделях предиктора.<\/p>\n<div class=\"e2-text-picture\">\n<img src=\"https:\/\/repushko.com\/pictures\/gradient_x.jpg\" width=\"664\" height=\"422\" alt=\"\" \/>\n<\/div>\n<p>Выяснили, что локальная метрика эстиматора напрямую коррелирует с результатами на ЛБ и что результат одного хорошего фолда лучше, чем его же со смесью фолдов чуть-чуть хуже. Опять упёрлись в то, что надо дотюнивать эстиматор. Вернулись к resnet’у.<\/p>\n<p><i>14 июля — 23 июля<\/i><br \/>\nСкор первого трека: <b>0.0552<\/b><\/p>\n<p>Разбирались с сегментацией, удивлялись кривой разметке, сложным случая с закрытыми глазами и т. д.<\/p>\n<p>Вытюнили 1 фолд для эстиматора до ошибки 0.000197 (в 3 раза лучше прошлых). В предиктор засунули простую эвристику: если статика, то скользящее среднее по 2 последним кадрам, а если была динамика в последних 5 кадрах, то добавляем градиент дальше до упора (из-за особенностей движения глаза, там бОльшая часть движений — линейная).<\/p>\n<p><i>23 июля — 29 июля<\/i><br \/>\nТюнили и думали над сегментацией. Смотрели на то, как нам применить синтетические данные в сегментаци. Генерировали синтетику.<\/p>\n<div class=\"e2-text-picture\">\n<img src=\"https:\/\/repushko.com\/pictures\/unity_eye.jpg\" width=\"1148\" height=\"648\" alt=\"\" \/>\n<div class=\"e2-text-caption\">Типичный несуществующий глаз<\/div>\n<\/div>\n<p>Из интересного: один сабмит пропустили, потому что кое-кто заснул от усталости и не слышал звонков с просьбой прислать данные. Два сабмита в два дня были сделаны за 30 и 20 секунд до сгорания.<\/p>\n<div class=\"e2-text-picture\">\n<img src=\"https:\/\/repushko.com\/pictures\/sega.png\" width=\"720\" height=\"720\" alt=\"\" \/>\n<div class=\"e2-text-caption\">Кусочек каких-то сравнений моделей по сегментации<\/div>\n<\/div>\n<p><i>30 июля — 31 июля<\/i><br \/>\nСкор первого трека: <b>0.0537<\/b><\/p>\n<p>Смотрели и думали над всякими сложными случаями в сегментации<\/p>\n<div class=\"e2-text-picture\">\n<img src=\"https:\/\/repushko.com\/pictures\/sega2.jpg\" width=\"1280\" height=\"287\" alt=\"\" \/>\n<\/div>\n<div class=\"e2-text-picture\">\n<img src=\"https:\/\/repushko.com\/pictures\/sega3.jpg\" width=\"1280\" height=\"277\" alt=\"\" \/>\n<\/div>\n<p>По первому треку доучили остальные бленды эстиматора, сблендили и засабмитили. Так и осталось нашим лучшим результатом.<\/p>\n<p>По сегментации остались на 8ом месте.<\/p>\n<h2>Что хотели попробовать, но не попробовали<\/h2>\n<ul>\n<li>Не использовали никакую синтетику, а скорее всгео надо было бы. Можно и в обоих треках<\/li>\n<li>Надо было учить LSTM на чистых данных (в том числе из теста и из трейна) и сразу на векторах. Наши эвристики в итоге были по каждой оси отдельно<\/li>\n<\/ul>\n",
            "date_published": "2020-08-04T21:38:13+03:00",
            "date_modified": "2020-08-17T15:21:44+03:00",
            "image": "https:\/\/repushko.com\/pictures\/099.png",
            "_date_published_rfc2822": "Tue, 04 Aug 2020 21:38:13 +0300",
            "_rss_guid_is_permalink": "false",
            "_rss_guid": "49",
            "_e2_data": {
                "is_favourite": true,
                "links_required": [],
                "og_images": [
                    "https:\/\/repushko.com\/pictures\/099.png",
                    "https:\/\/repushko.com\/pictures\/lb.jpg",
                    "https:\/\/repushko.com\/pictures\/eye.jpg",
                    "https:\/\/repushko.com\/pictures\/pupil_center.jpg",
                    "https:\/\/repushko.com\/pictures\/countur_orig.jpg",
                    "https:\/\/repushko.com\/pictures\/countur.jpg",
                    "https:\/\/repushko.com\/pictures\/static_gaze.jpg",
                    "https:\/\/repushko.com\/pictures\/saccade.jpg",
                    "https:\/\/repushko.com\/pictures\/vector_visualize.jpg",
                    "https:\/\/repushko.com\/pictures\/submit.jpg",
                    "https:\/\/repushko.com\/pictures\/submit_bot.jpg",
                    "https:\/\/repushko.com\/pictures\/ezgif.com-video-to-gif.gif",
                    "https:\/\/repushko.com\/pictures\/orig.jpg",
                    "https:\/\/repushko.com\/pictures\/flipped.jpg",
                    "https:\/\/repushko.com\/pictures\/shift_scale_rotate.jpg",
                    "https:\/\/repushko.com\/pictures\/mask.jpg",
                    "https:\/\/repushko.com\/pictures\/savgol_2.jpg",
                    "https:\/\/repushko.com\/pictures\/gradient_x.jpg",
                    "https:\/\/repushko.com\/pictures\/unity_eye.jpg",
                    "https:\/\/repushko.com\/pictures\/sega.png",
                    "https:\/\/repushko.com\/pictures\/sega2.jpg",
                    "https:\/\/repushko.com\/pictures\/sega3.jpg"
                ]
            }
        },
        {
            "id": "41",
            "url": "https:\/\/repushko.com\/all\/srednenko-poc\/",
            "title": "«Средненько». Проверка гипотезы",
            "content_html": "<h2>Мотивация<\/h2>\n<p>Я 3-4 года назад услышал про исследование <a href=\"https:\/\/strelka-kb.com\/\">КБ «Стрелка»<\/a>, в котором они скрапили фото из социальных сетей (Инстаграм и ВК) и рисовали хитмапы на картах по ним. Оказывается, это называется <a href=\"https:\/\/strelkamag.com\/ru\/article\/est-takaya-professiya-cifrovoi-antropolog\">цифровой антропологией<\/a>.<\/p>\n<p>Идея кейса, который вдохновил меня, в том, что такое исследование помогло в каком-то там городе РФ выбрать лучшую точку для открытия общественного пространства. Гипотеза такая: если люди где-то делают фото, значит уже проводят там время, а значит там и так всё хорошо с социальной жизнью. В итоге администрации посоветовали открыть новую точку интереса на противоположном конце города от существующей.<\/p>\n<p>Загорелся идеей сделать нечто похожее, но в сферу каких-то постоянных событий идея оставалась идеей без реализации.<\/p>\n<p>Закрывая гештальт (как Инстаграм своё API для доступа к гео-информации о фотографиях в 2016-ом) достиг успеха.<\/p>\n<h2>Реализация<\/h2>\n<p>Т. к. API Инстаграма оказалось закрытым, решил воспользоваться <a href=\"https:\/\/www.flickr.com\/\">Flickr’ом<\/a>.<br \/>\nСуть идеи:<\/p>\n<ul>\n<li>берем 2019ый год,<\/li>\n<li>cкрапим фотографии с Flickr для конкретной локации (т.e. города),<\/li>\n<li>аккуратно накладываем на карту,<\/li>\n<li>видим места, где люди много фотографируют,<\/li>\n<li>делаем какие-то выводы.<\/li>\n<\/ul>\n<p><b>Например<\/b>: люди фотографируют -> там что-то интересное -> логично поселиться во время поездки.<\/p>\n<p><b>Другой например<\/b>: можно увидеть места, которые недостаточно освещены туристически (с точки зрения наличия фотографий) и можно выбрать наоборот район, где живут местные. На примере Берлина эта теория вроде как работает.<\/p>\n<div class=\"e2-text-picture\">\n<img src=\"https:\/\/repushko.com\/pictures\/berlin_flickr_project_2019.jpg\" width=\"1280\" height=\"684\" alt=\"\" \/>\n<div class=\"e2-text-caption\">Фотографии в Берлине за 2019ый год<\/div>\n<\/div>\n<p>Найденные подводные камни:<\/p>\n<ul>\n<li>API Flickr’a частично не завелось из python-обертки, которую я нашёл,<\/li>\n<li>фотографий не так много (250к за год), как в Инстаграме. С геопозицией — еще меньше. За 2019ый год только 44к для Берлина,<\/li>\n<li>на карте прямыми линиями из фотографий заметны фотопрогулки, когда один человек шел и фотографировал всё, что видел. Так получается много фотографий одного места, хотя это всего лишь от одного человека. В планах написать кастомную функцию хитмапа, которая бы давала больший вес участкам, где фотографии от разных людей. Так получится сильно честнее.<\/li>\n<\/ul>\n<h2>«Средненько»<\/h2>\n<p>В процессе возникла идея — сопоставить кучу фотографий одной достопримечательности для получения её «усреднённого» вида. Итог получился сильно лучше, чем я ожидал.<\/p>\n<div class=\"e2-text-picture\">\n<img src=\"https:\/\/repushko.com\/pictures\/ansgar-scheffold-cyUf9E_mhFc-unsplash.jpg\" width=\"2560\" height=\"1701\" alt=\"\" \/>\n<div class=\"e2-text-caption\">Оригинальные Бранденбургские ворота<\/div>\n<\/div>\n<div class=\"e2-text-picture\">\n<img src=\"https:\/\/repushko.com\/pictures\/average_brandenburg_gates.jpg\" width=\"1280\" height=\"774\" alt=\"\" \/>\n<div class=\"e2-text-caption\">Усреднённые 55 фотографий Бранденбургских ворот<\/div>\n<\/div>\n<p>Когда-то вероятно продолжу и сделаю для других городов.<\/p>\n",
            "date_published": "2020-04-26T01:05:52+03:00",
            "date_modified": "2020-04-26T01:05:49+03:00",
            "image": "https:\/\/repushko.com\/pictures\/berlin_flickr_project_2019.jpg",
            "_date_published_rfc2822": "Sun, 26 Apr 2020 01:05:52 +0300",
            "_rss_guid_is_permalink": "false",
            "_rss_guid": "41",
            "_e2_data": {
                "is_favourite": true,
                "links_required": [],
                "og_images": [
                    "https:\/\/repushko.com\/pictures\/berlin_flickr_project_2019.jpg",
                    "https:\/\/repushko.com\/pictures\/ansgar-scheffold-cyUf9E_mhFc-unsplash.jpg",
                    "https:\/\/repushko.com\/pictures\/average_brandenburg_gates.jpg"
                ]
            }
        },
        {
            "id": "37",
            "url": "https:\/\/repushko.com\/all\/barkody-seriala-tales-from-the-loop\/",
            "title": "Баркоды сериала «Tales from the Loop»",
            "content_html": "<p>Сделал баркоды, как и с <a href=\"https:\/\/repushko.com\/all\/barkody-seriala-chernobyl\/\">сериалом «Чернобыль»<\/a>. Каждая полоса — средний цвет кадра в этот момент времени.<\/p>\n<div class=\"e2-text-picture\">\n<img src=\"https:\/\/repushko.com\/pictures\/S1E1.jpg\" width=\"1700\" height=\"400\" alt=\"\" \/>\n<div class=\"e2-text-caption\">«Loop»<\/div>\n<\/div>\n<div class=\"e2-text-picture\">\n<img src=\"https:\/\/repushko.com\/pictures\/S1E2.jpg\" width=\"1700\" height=\"400\" alt=\"\" \/>\n<div class=\"e2-text-caption\">«Transpose»<\/div>\n<\/div>\n<div class=\"e2-text-picture\">\n<img src=\"https:\/\/repushko.com\/pictures\/S1E3.jpg\" width=\"1700\" height=\"400\" alt=\"\" \/>\n<div class=\"e2-text-caption\">«Stasis»<\/div>\n<\/div>\n<div class=\"e2-text-picture\">\n<img src=\"https:\/\/repushko.com\/pictures\/S1E4.jpg\" width=\"1700\" height=\"400\" alt=\"\" \/>\n<div class=\"e2-text-caption\">«Echo Sphere»<\/div>\n<\/div>\n<div class=\"e2-text-picture\">\n<img src=\"https:\/\/repushko.com\/pictures\/S1E5.jpg\" width=\"1700\" height=\"400\" alt=\"\" \/>\n<div class=\"e2-text-caption\">«Control»<\/div>\n<\/div>\n<div class=\"e2-text-picture\">\n<img src=\"https:\/\/repushko.com\/pictures\/S1E6.jpg\" width=\"1700\" height=\"400\" alt=\"\" \/>\n<div class=\"e2-text-caption\">«Parallel»<\/div>\n<\/div>\n<div class=\"e2-text-picture\">\n<img src=\"https:\/\/repushko.com\/pictures\/S1E7.jpg\" width=\"1700\" height=\"400\" alt=\"\" \/>\n<div class=\"e2-text-caption\">«Enemies»<\/div>\n<\/div>\n<div class=\"e2-text-picture\">\n<img src=\"https:\/\/repushko.com\/pictures\/S1E8.jpg\" width=\"1700\" height=\"400\" alt=\"\" \/>\n<div class=\"e2-text-caption\">«Home»<\/div>\n<\/div>\n",
            "date_published": "2020-04-21T15:24:26+03:00",
            "date_modified": "2020-04-21T18:15:37+03:00",
            "image": "https:\/\/repushko.com\/pictures\/S1E1.jpg",
            "_date_published_rfc2822": "Tue, 21 Apr 2020 15:24:26 +0300",
            "_rss_guid_is_permalink": "false",
            "_rss_guid": "37",
            "_e2_data": {
                "is_favourite": true,
                "links_required": [],
                "og_images": [
                    "https:\/\/repushko.com\/pictures\/S1E1.jpg",
                    "https:\/\/repushko.com\/pictures\/S1E2.jpg",
                    "https:\/\/repushko.com\/pictures\/S1E3.jpg",
                    "https:\/\/repushko.com\/pictures\/S1E4.jpg",
                    "https:\/\/repushko.com\/pictures\/S1E5.jpg",
                    "https:\/\/repushko.com\/pictures\/S1E6.jpg",
                    "https:\/\/repushko.com\/pictures\/S1E7.jpg",
                    "https:\/\/repushko.com\/pictures\/S1E8.jpg"
                ]
            }
        },
        {
            "id": "18",
            "url": "https:\/\/repushko.com\/all\/osobennosti-pip\/",
            "title": "Особенности pip и потенциальная дырка",
            "content_html": "<p>Не вдаваясь конкретно в библиотеки (это два клиента для <i>keycloak<\/i>), расскажу о ситуации.<\/p>\n<p>Есть библиотека <b>А<\/b> и библиотека <b>B<\/b>. Библиотеки <b>А<\/b> и <b> B<\/b> обе зарегистрированы в <i>pypi<\/i> под разными именами. Но в <i>setup.py<\/i> обе экспортируют одинаковые по имени пакеты (параметр <i>packages<\/i>), которые и буду в итоге отображены в вашем списке пакетов. Как вы думаете, как поступит <i>pip<\/i>, если указать ему обе библиотеки в зависимостях проекта?<\/p>\n<p>... минутка на подумать ...<\/p>\n<p>Он их смёржит между собой. При этом будет устанавливать одну библиотеку поверх другой, в порядке как в списке зависимостей. Я не нашёл ни в документации ни где-то ещё описания такого поведения. А оно приводит например к следующему:<\/p>\n<ul>\n<li>у вас в списке зависимостей библиотека <b>A<\/b> идёт перед библиотекой <b>B<\/b>,<\/li>\n<li>и там и там есть файл <i>exceptions.py<\/i>, в котором прописаны исключения,<\/li>\n<li>после установки библиотеки <b>B<\/b>, файл <i>exceptions.py<\/i> будет из библиотеки <b>B<\/b>, при этом уникальные для библиотеки <b>А<\/b> файлы так и останутся на месте и в импортах будет использоваться <i>exceptions.py<\/i>, который уже от другой библиотеки,<\/li>\n<li>как минимум это приводит к конфликтам, ошибкам и дебагу.<\/li>\n<\/ul>\n<p>Ещё интересным выглядит вектор раскручивания этого до уязвимости: а что, если мы в нашей библиотеке (или в зависимостях нашей библиотеки) пропишем какое-то популярное имя пакета (например <i>Flask<\/i>) и переопределим поведение? Т.e. любой, кто установит нашу библиотеку не глядя на то, что внутри, имеет шанс запустить у себя наш код не подозревая об этом. Достаточно просто нашу библиотеку в списке зависимостей разместить ниже фреймворка, в который мы лезем.<\/p>\n<p>Мем конечно смешной, а ситуация страшная.<\/p>\n<p>Решил сходить и спросить у знающих людей, как так можно жить. <a href=\"https:\/\/orsinium.dev\">Никита Воронов<\/a> делает <a href=\"https:\/\/github.com\/dephell\/dephell\">dephell<\/a> и рассказал, что это не баг, а фича.<\/p>\n<blockquote>\n<p>Так можно делать отдельные пакеты с плагинами, которые положат себя в папку <i>plugins<\/i>. Причём много кто  это делает, так что поведение уже поздно менять. Про опасность пакетов вообще бесполезно говорить. Уже при установке пакет может в <i>setup.py<\/i> что угодно сделать. Например, слить твой ssh ключ. Так что недоверенные пакеты устанавливать вообще нельзя. Можно <a href=\"https:\/\/pages.charlesreid1.com\/dont-sudo-pip\/\">почитать<\/a>, почему никогда нельзя звать<i> sudo pip install<\/i>. Проблема в том, что альтернатив нет, а все другие пакетные менеджеры (в том числе и <i>dephell<\/i>) всё равно внутри зовут <i>pip<\/i>.<\/p>\n<\/blockquote>\n<p>Всё это грустно. Ну и надо думать над тем, как называть пакеты и смотреть, есть ли кто-то уже с таким же именем в <i>pypi<\/i>. Для решения моего конфликта оказалось проще руками затащить часть одной из либ в проект. Другой найденный вариант — использовать <i>install-options pip’a<\/i> и <i>prefix<\/i> для задания кастомного пути одной из либ.<\/p>\n<p>Ну и конечно устанавливайте только доверенные пакеты.<\/p>\n",
            "date_published": "2019-09-23T13:32:58+03:00",
            "date_modified": "2019-09-23T13:33:55+03:00",
            "_date_published_rfc2822": "Mon, 23 Sep 2019 13:32:58 +0300",
            "_rss_guid_is_permalink": "false",
            "_rss_guid": "18",
            "_e2_data": {
                "is_favourite": false,
                "links_required": [],
                "og_images": []
            }
        },
        {
            "id": "15",
            "url": "https:\/\/repushko.com\/all\/barkody-seriala-chernobyl\/",
            "title": "Баркоды сериала «Чернобыль»",
            "content_html": "<p>Вспомнил про идею <a href=\"https:\/\/moviebarcode.tumblr.com\/\">moviebarcode<\/a> и сделал тоже самое для сериала «Чернобыль» от HBO.<br \/>\nДля каждого кадра серии посчитал средний цвет и выстроил по таймлайну. Сделал всё через OpenCV и Python.<br \/>\nПолучилась такая красота:<\/p>\n<div class=\"e2-text-picture\">\n<img src=\"https:\/\/repushko.com\/pictures\/chernobyl_1_resized.jpg\" width=\"1693\" height=\"400\" alt=\"\" \/>\n<div class=\"e2-text-caption\">1:23:45<\/div>\n<\/div>\n<div class=\"e2-text-picture\">\n<img src=\"https:\/\/repushko.com\/pictures\/chernobyl_2_resized.jpg\" width=\"1867\" height=\"400\" alt=\"\" \/>\n<div class=\"e2-text-caption\">Пожалуйста, сохраняйте спокойствие<\/div>\n<\/div>\n<div class=\"e2-text-picture\">\n<img src=\"https:\/\/repushko.com\/pictures\/chernobyl_3_resized.jpg\" width=\"1776\" height=\"400\" alt=\"\" \/>\n<div class=\"e2-text-caption\">Откройся широко, о Земля!<\/div>\n<\/div>\n<div class=\"e2-text-picture\">\n<img src=\"https:\/\/repushko.com\/pictures\/chernobyl_4_resized.jpg\" width=\"1868\" height=\"400\" alt=\"\" \/>\n<div class=\"e2-text-caption\">Счастье всего человечества<\/div>\n<\/div>\n<div class=\"e2-text-picture\">\n<img src=\"https:\/\/repushko.com\/pictures\/chernobyl_5_resized.jpg\" width=\"2057\" height=\"400\" alt=\"\" \/>\n<div class=\"e2-text-caption\">Вечная память<\/div>\n<\/div>\n",
            "date_published": "2019-06-18T22:22:22+03:00",
            "date_modified": "2020-04-19T14:45:51+03:00",
            "image": "https:\/\/repushko.com\/pictures\/chernobyl_1_resized.jpg",
            "_date_published_rfc2822": "Tue, 18 Jun 2019 22:22:22 +0300",
            "_rss_guid_is_permalink": "false",
            "_rss_guid": "15",
            "_e2_data": {
                "is_favourite": true,
                "links_required": [],
                "og_images": [
                    "https:\/\/repushko.com\/pictures\/chernobyl_1_resized.jpg",
                    "https:\/\/repushko.com\/pictures\/chernobyl_2_resized.jpg",
                    "https:\/\/repushko.com\/pictures\/chernobyl_3_resized.jpg",
                    "https:\/\/repushko.com\/pictures\/chernobyl_4_resized.jpg",
                    "https:\/\/repushko.com\/pictures\/chernobyl_5_resized.jpg"
                ]
            }
        },
        {
            "id": "7",
            "url": "https:\/\/repushko.com\/all\/zapyatye-i-taply\/",
            "title": "Запятые и таплы",
            "content_html": "<p>Долго искал классическую и глупую ошибку. Обстановка такая:<\/p>\n<pre class=\"e2-text-code\"><code class=\"\">class TestView(View):\r\n    def __init__(self, storage_arg: Storage):\r\n        self.storage = storage_arg,\r\n        ...\r\n\r\n    def get_item_name(id):\r\n        ...\r\n        return self.storage.name(id)<\/code><\/pre><p><i>self.storage<\/i> внезапно оказывается <i>tuple&lt;Storage><\/i>, хотя <i>storage_arg<\/i> типа <i>Storage<\/i>.<\/p>\n<p>Легко догадаться, что проблема в лишней запятой после <i>storage_arg<\/i>. В питоне код <i>1,<\/i> создаст тапл из одного элемента.<\/p>\n<p>Установил <a href=\"https:\/\/pypi.org\/project\/flake8-commas\/\">расширение для flake8<\/a>, чтобы больше на таком не попадаться.<\/p>\n",
            "date_published": "2019-02-14T01:06:45+03:00",
            "date_modified": "2019-02-14T15:14:04+03:00",
            "_date_published_rfc2822": "Thu, 14 Feb 2019 01:06:45 +0300",
            "_rss_guid_is_permalink": "false",
            "_rss_guid": "7",
            "_e2_data": {
                "is_favourite": false,
                "links_required": [
                    "system\/library\/highlight\/highlight.js",
                    "system\/library\/highlight\/highlight.css",
                    "system\/library\/highlight\/highlight.js",
                    "system\/library\/highlight\/highlight.css"
                ],
                "og_images": []
            }
        },
        {
            "id": "4",
            "url": "https:\/\/repushko.com\/all\/dtp-stat-helpers\/",
            "title": "Скрипты для очистки данных со stat.gibdd.ru",
            "content_html": "<p>Написал <a href=\"https:\/\/github.com\/repushko\/dtp_stat_helpers\">пару скриптов<\/a> для исправления координат ДТП.<\/p>\n<p>Процесс состоит из двух шагов:<\/p>\n<ul>\n<li>привязка координат ДТП к адресу (он обычно заполняется правильно),<\/li>\n<li>проекция координат адреса на ближайшую улицу. Скрипт может не работать в России без VPN.<\/li>\n<\/ul>\n<p>Не вынес отдельно конфигурацию, поэтому лучше всё запускать по шагам у себя в тетрадках и настраивать под себя.<\/p>\n",
            "date_published": "2019-02-04T15:16:09+03:00",
            "date_modified": "2019-02-14T01:07:07+03:00",
            "_date_published_rfc2822": "Mon, 04 Feb 2019 15:16:09 +0300",
            "_rss_guid_is_permalink": "false",
            "_rss_guid": "4",
            "_e2_data": {
                "is_favourite": false,
                "links_required": [],
                "og_images": []
            }
        }
    ],
    "_e2_version": 3565,
    "_e2_ua_string": "E2 (v3565; Aegea)"
}