Свет летит и летит и летит, и летитГениально они сделали. Убрали Websql из service worker

Это всё о чём нужно знать про "вакансии" на хабр-карьере

Вот смотрите на картинку, сейчас суббота, прекрасное солнечное утро, на улице мороз и солнце, -22, а на картинке видно, как ровно в 9:27 с разницей в ОДНУ секунду обновились три спамные вакансии от компании "Холдинг Т1". У YADRO вон вообще одновременно. Человек так нажать на кнопку обновления не сможет физически.
Это именно старые вакансии, а не новые, потому что у новых guid уже превышает *138800.

То есть, здесь всё прекрасно, на этой картинке, а на всей базе данных ещё веселее.

Например, видно, как компания Холдинг Т1 никак не может найти «Senior Java-разработчик» по вакансии 1000113370, которая, судя по номеру guid, была создана юх сколько недель назад.
Я только начал складывать вакансии в базу и видно, что появились новые вакансии от компании Rocket Tech, которые с guid 1000138824, вот у них pubDate будет уже отсчётом создания вакансии, а не обновления. Просто это понятно через анализ данных.

Ну а дальше в планах набросать фильтр, который будет искать самые адекватные вакансии от живых людей и компаний, а не вот эти бесконечные спамные вакансии, которые наверное по большей части используются для сбора данных кандидатов, а на самом деле нет там никакой работы.

Если в сутках могут добавлять около 50..100 вакансий, то разница 25000 в guid это примерно 1 год. Пусть даже полгода. Вот примерно такое время они "не могут найти" работника. Конечно, такого не может быть, поэтому ежу понятно, что это тупо сбор данных. Обычно нормальные вакансии закрываются за месяц-два.

Вон смотрим, у "Digital agency AIM" вообще всё плохо и они никак не могут найти «It-рекрутер в команду aim», вакансия создана примерно 4 года назад.

Сима-ленд уже 3 года ищет «Backend-разработчик (Middle-to-Senior)» (Екатеринбург, до 300 000 ₽)

Группа Астра постоянно вот уже в течение двух лет обновляет свои вакансии «iOS разработчик (middle/senior)», «Программист С++/Qt (KDE)», «Инженер Linux (отдел разработки ОС)»

Fix Price уже пару лет не может найти (или у них текучка) «Frontend-разработчик (vue.js)»

Вообще не вижу смысла откликаться на подобные вакансии в подобные компашки, да и пробовал, там тебе отвечает какой-нибудь робот.

За пару дней наблюдений заметил интересную особенность поднятия вакансий. Например, вакансии от "Bell Integrator" + "YADRO" + "ЛАНИТ" + "Яндекс" обновляются одновременно, в одну и ту же секунду примерно. Вероятно, ими всеми управляет какой-то один человек или даже бот. Конечно, можно предположить, что эти компании связаны как-то, юридически, например. Но может быть и просто, что вакансии поднимает один механизм. То же самое по группе "SM Lab" + "beeline" + "Hoff Tech" + "ДИТ г. Москвы", "2GIS" + "Холдинг Т1" + "TINKOFF" + "МТС" + "Группа «Самолет»" + "YADRO" + "Магнит", "СберКорус" + "Группа Астра", "Банк ПСБ" + "ИТ-компания «Лоция»" + "Way to Win".
Конечно, здесь может быть просто совпадение и нужно анализировать на большем количестве совпадений, но как минимум 2...3 раза совпадения замечены по данным группам в разное время.

Ну и забавно наблюдать, как в выходные вакансии поднимают. Люди работают без выходных? Или это бот делает?

Очень много поднятий от почти одних и тех же компаний. Одну и ту же вакансию поднимают раз в сутки. Даже если не раз в сутки, эти вакансии как мишура заюивают канал. Зачем это нужно, непонятно. Но из-за этого нормальные вакансии оказываются в самом низу, на какой-нибудь 5...10 странице, чтобы их увидеть, нужно просто пролистать всю эту поднятую мишуру, затратить кучу времени на отсев

Там ещё много чего интересного, а через месяцок сбора базы проявится ещё больше.

Главная цель - написать фильтр, ищущий живые алмазы среди всей этой кучи ботного говна.
Такие вакансии есть, но муторно их искать среди другой мишуры, пролистывать десятки страниц.
Теперь просто напишу типа WHERE `author` != 'Группа Астра' и всё.
И другие фильтры добавить, там есть теги и так далее.

.По сути, сделаю rss с чистыми живыми вакансиями от живых компаний, в который будет попадать небольшое количество хороших вакансий.