Собственно существуют различные сайты с информацией о кинотеатрах различных городов и показах в них. Самые крупные известные мне - это кино афиша и кино поиск яндекса. Интересует откуда они берут информацию, сомневаюсь что база заполняется в ручную. Существует ли некое свободно доступное API? Или какие есть варианты?
Ответ
Мой ответ (по крайней мере пока что) не будет претендовать на ответ, в нужном нам смысле слова, но оставлю некоторые заметки, чтобы не пропали, а кто-то мб пойдет в изучении дальше.
Во-первых, как мы понимаем, государство регулирует рынок кинопроката. Картины допускаются к прокату с разрешения каких-то там комиссий, и соответственно отслеживается что и где показывается. Поэтому, если думаешь, что государство что-то мониторит - гугли "единая государственная система" и добавляй предмет поиска, в нашем случае "кино".
Дальше переходим на сайт "Электронный кинобилет" (видимо какая то первая версия на скорую руку). Тут нам без логина и пароля делать почти нечего. Однако мы видим, красным шрифтом, что имеется Программа ручного формирования XML- файлов с информацией о продаже кинобилетов CreateXML. А также в наличие ссылка на скачивание программы. В архиве есть руководство пользователя. Из руководства видно, что программа написана в delphi (вроде 2009). Введение гласит:
Предназначена программа для кинотеатров и сетей кинотеатров, не
имеющих автоматизированных систем продажи билетов, небольших прокатных
организаций, сельских кинотеатров, кинопередвижек и др.
Отсюда 2 вывода:
Есть автоматизированные системы продажи билетов, которые напрямую самостоятельно отправляют данные по продажам в ГИВЦ (главный информационно вычислительный центр) МинКультуры
Те, кто не может себе позволить такую роскошь, обязаны заполнять данные вручную с помощью указанной CreateXML
Руководство пользователя писал, очевидно, весьма одаренный человек, иначе я не могу объяснить, как вообще может в голову прийти написать следующий текст к диалогу для указания URL-загрузки файлов (и почему вообще этот URL можно настраивать тоже не ясно):
В данной закладке задаются адреса, по которым осуществляется от-правка
XML-файлов. Эти адреса заданы по умолчанию и не рекомендуется с ними
экспериментировать.
Далее, зная название системы можно заглянуть в википедию, где в копилку знаний можно добавить следующее:
В России отслеживанием кассовых сборов занимается Фонд Кино.
Отраслевая аналитика строится на основе данных Единой Федеральной
автоматизированной информационной системы сведений о показах фильмов в
кинозалах (ЕАИС).
Переходим на сайт ЕАИС. Можем посмотреть ютуб-ролик. Видим, что есть приложение, следовательно, скорее всего есть API, публичный или закрытый - не ясно. Упоминаний про API на сайте не видно. Разработчики сайта скорее всего могут дать больше информации по данному вопросу. На странице Статистика-Прокат можно какие-то отчеты выгружать в Excel. Который в принципе уже поддается обработке, как и парсинг самой страницы.
Следующий этап - узнать про API, тут уж либо гуглить, либо посмотреть, что там мобильное приложение и куда шлет, или сайт куда ajax-запрашивает. Но это за пределами моего сегодняшнего гугло-сеанса. Передаю эстафету.
Комментариев нет:
Отправить комментарий