Тег ‘технологии высокаго пошибу’

Машинный перевод

Угадайте, как правильно перевести на английский “пол в машинном зале должен быть ровным”? Правильно:

Sex in the engine room must be smooth

https://gunkies.org/wiki/CM_1700

Главное правило машинного перевода – если фраза допускает смешной или похабный перевод, она будет переведена именно так.

Роботы-ебоботы

В ближайшем “Перекрестке” во время похода за бухлом был замечен робот-пылесос Polaris непонятной модели, но за 3999 по карте:

robo-perek

Стоит ли такое покупать и вообще, на что надо обращать внимание при выборе робота-пылесоса? Или бесполезная игрушка, пригодная только для того, чтобы катать кошку?

Чуваки, а вот охуенное

https://www.academia.edu/43760536/Открытие_долготы_и_Первый_Транзитный_проект

Автор уже известен в узких кругах серией развеселых материалов про Семилетнюю войну – а тут немного об истории науки и техники, где Семилетняя война служит этаким фоном. Написано очень живо, и при этом разносторонне – от описания нюансов часовых механизмов до творчества Франсуа Буше (”Обветшавшие, но официально-требуемые тряпицы католической религии ещё заставляли облекать буйства плоти на картине в организационные рамки, отличные от современного сюжета «Пришёл водопроводчик»” – примерно в таких терминах).

50 (на самом деле 25) вопросов по дата саенсу

А если бы она еще одну пуговку расстегнула – я бы даже на “биноминальное” распределение не обратил бы внимания!

И Др

Какие впечатляющие наукометрические показатели!

https://istina.msu.ru/profile/idr/

Про контекстную рекламу еще раз

Вот squeezedorange меня пугает, что не надо искать в пейсбуке всяких странных баб – а я вчера рассказал в ватсапе московский анекдот времен ССС:

- Когда мы придем к власти, то расстреляем всех евреев и велосипедистов!
- А евреев-то за что?

- а сегодня наслаждаюсь рекламой самых разных мобильных крематориев.

Системный подход

system_approach

Впрочем, я не готов проводить ретроспективу после коитуса, как учат нас тренеры по Agile.

UPD, а также PS: зачем я набрал ЭТО в фейсбуке?

А вот вам видосик позалипать

Между прочим, показанное в ролике гораздо ближе к идеологии Industry 4.0, чем весь этот разводняк с 3D-принтерами.

Человечество отупело

Вот примерно каждый год с большим пафосом сообщают, что где-то в очередной раз с помощью “3D-печати” сумели построить дом – вот как-то так:

https://ru.euronews.com/2020/07/08/3d-printed-house-in-belgium

Комментаторы в интернете тут же предрекают революцию в строительстве и все такое – а мне что-то кажется, что все это в плане хайтека и рядом не стояло с индустриальным домостроением. Обычная панельная хрущевка, или, если вам милее одноэтажная Америка – Levitt house, в сравнении с любым таким напечатанным на 3D-принтере сарайчиком – технологический шедевр, причем во всех отношениях – от массового производства стандартных комплектующих до обеспечивающей все это логистики.

С другой стороны, похоже, что для интеллекта среднего интернетовского комментатора осознать это сложновато, а “символ прогресса” в виде 3D-печати доступен пониманию даже полуидиота.

О чем говорят мужчины

Форум с преимущественно мужским населением, тема про тиндер. Фотки блядей, малолеток и блядей-малолеток с претензией на интеллектуальность в подписях обсуждать надоело, ждущих принца РСП – тем более, так что разговор плавно сполз в обсуждение методов триангуляции, геодезии и даже систем управления огнем английских линкоров ПМВ – а все оттого, что двое почти одновременно увидели одну и ту же смешную фотку.

Iditi srati!

К какой-то музыкальной программе есть плагин стоимостью 499$, умеющий изображать пение хора – и в числе прочих функций, можно заставить хор петь разные слоги. К сожалению, набор вариантов довольно ограничен, и на русском языке удалось собрать только фразу “Идите срать!” – точнее, “I-di-tis-ra-ti”. В видео – с 8:00:

Хор, старательно выводящий эту фразу, просто офигенен.

Обожаю медузоньку

Вот чувачки пишут: “мы нашли уязвимость в электронном голосовании, не знаем, как этим воспользоваться, но нас всех наебут!!!!1111″:

https://meduza.io/feature/2020/07/01/meduza-nashla-uyazvimost-v-sisteme-internet-golosovaniya-chast-golosov-mozhno-rasshifrovat-esche-do-ofitsialnogo-podscheta

Собственно, “уязвимость” состоит в том, что зная созданный в ходе процедуры голосования закрытый ключ и еще один параметр (nonce), можно самостоятельно повторить шифрование голоса и убедиться, что именно этот зашифрованный голос оказался в итоговом списке. Казалось бы, можно радоваться? Но нет, “если залезть на шкаф”, эту возможность якобы можно использовать для нарушения тайны голосования. То, что злоумышленнику для этого понадобится слишком много сделать – как минимум, встроить свой нехороший код во все пользовательские браузеры – как-то вообще не рассматривается.

А вообще такие громкие заявления – от банальной недоступности информации, как это все работает. Можно взять пример хотя бы с Эстонии, систему электронного голосования которой разобрали вдоль и поперек:

https://arxiv.org/pdf/1606.08654.pdf

Хотите описания “для широкой аудитории”? Пожалуйста:

http://www.vvk.ee/public/dok/General_Description_E-Voting_2010.pdf

Хотите анализ уязвимостей? Никаких проблем:

http://www.vvk.ee/public/dok/E-voting_concept_security_analysis_and_measures_2010.pdf

Опубликован полный исходный код (а не как у ДИТ Москвы, с купюрами в самых интересных местах):

https://github.com/vvk-ehk/ivxv

Вот такой уровень открытости и не позволяет выдавать очевидное за невероятные находки.

S in IoT stands for security

smart-scale

Угробил планшет

Уронил и разбил экран на своем заслуженном Lenovo A10-70, с которым были выиграны многочисленные соревнования по р3к (блин, надо бы про это все как-нибудь написать, а то я с сезона 2017 года писать про свои успехи бросил). Короче говоря – а что сейчас стоит брать с учетом не сильно изменившихся с 2015 года требований:

- свежая версия Android, с минимальным количеством постороннего говна;
- экран 10″, не менее 200 dpi;
- сотовая связь, WiFi, Bluetooth (не хуже 4.0), хорошо работающий GPS.

Я так понимаю, стоит остаться лояльным марке и взять Lenovo TB-X605L?

Про IT-компании

Обсуждают льготы для “IT-компаний”, предложенные вчера Путиным. Во-первых, некоторое недоумение вызывает вопрос – что же такое “IT-компания”? Ответ на него очевиден, но многим неизвестен – это компания, включенная в особый список Минцирка (МИНистерство ЦИфрового Развития, связи и массовых Коммуникаций):

https://digital.gov.ru/ru/activity/govservices/1/

По состоянию на 15.06.2020 в списке, представленном в виде таблички формата xls (КМПВ, узнаем, почему не csv или что-то “открытое”, а за использование старых форматов M$ будем отправлять на Колыму), числится 11452 организации. Кроме того, в списке есть ОГРНы и ИННы компаний – а поэтому на сайтах вроде какого-нибудь zachestnyibiznes несложно найти информацию о любой из них – например, о ООО “ТЛМ Ком” под номером 1 в списке:

https://zachestnyibiznes.ru/company/ul/1045207810218_5262128494_OOO-TLM-KOM

К сожалению, фирма уже ликвидирована, а вот номер 2 в списке – ООО “ТЭЛМА Софт” – живет и здравствует, переименовавшись в “Харман”:

https://zachestnyibiznes.ru/company/ul/1025203734841_5262068365_OOO-HARMAN

Конечно, правильнее было бы брать эту информацию у налоговой – как, собственно, все эти зачестные бизнесы и руспрофайлы и поступают – но выгрузка ЕГРЮЛ довольно сложна и кишит странностями.

И еще пара вводных – во-первых, льготы по налогу на прибыль, очевидно, распространяются на тех, кто его платит – то есть сидит на общей системе налогообложения, а не на “упрощенке”; во-вторых, количество работников в компании должно быть не менее 7 человек. Если вы представляете себе среднюю российскую ИТ-компанию – то, наверное, уже почувствовали, что на льготы могут расчитывать далеко не все. Скажем, очень многие сидят на “упрощенке” – она действительно сильно упрощает жизнь, особенно если ваши клиенты – такие же “упрощенщики” или физические лица. Численность в 7+ человек – тоже сравнительно много, особенно учитывая популярность работы с фрилансерами, когда в штате фирмы – буквально три-четыре наиболее незаменимых человека, а остальные работают по договорам ГПХ или регистрируются, как индивидуальные предприниматели (в особо запущенных случаях это превращается в “схему Ходорковского”, но не будем показывать пальцем :) ).

В общем, возникает желание проверить – а многие ли в этом списке подпадают под льготы. Основная проблема – невозможно надежно определить, пользуется ли контора УСН или нет по страничке с данными. Для части фирм на УСН встречается надпись “Упрощенная система налогообложения (УСН) (на 2018 год)” – но сделать по ней или ее отсутствию надежный вывод о том, каким налоговым режимом пользуется фирма, нельзя. Впрочем, как первое приближение – сойдет. Не для всех фирм есть сведения о количестве работников – в первую очередь это касается недавно зарегистрированных, но им все равно придется ждать не менее 9 месяцев, чтобы получить право на льготы. В общем, пишем под пивко несложный питоновский скрипт (я нихера не питонист, так что особо палками и камнями не кидайтесь):


import requests
import re
from bs4 import BeautifulSoup
import pandas as pd

elegible = 0

def get_info(id):
    global elegible

    working = False
    workers = False
    osn = True # так как система налогообложения определяется неоднозначно

    # на случай 1167847383824 (бывш. 1037841001681) и т. п.
    if not isinstance(id, int):
        id = int(id.split(' ')[0])

    # поиск по ОГРН
    url = 'https://zachestnyibiznes.ru/search?query=' + str(id)
    r = requests.get(url) # получаем результаты поиска
    if r.status_code != 200:
        print('Error ' + str(r.status_code) + ' for OGRN=' + str(id))
        return

    # вытаскиваем ссылку на страницу компании
    soup = BeautifulSoup(r.content, features='lxml')
    res = soup.find_all('td', class_='hidden-print')
    url = res[0].find_all('a')[0].get('href')

    # загружаем страницу с информацией о компании
    url = 'https://zachestnyibiznes.ru' + url
    r = requests.get(url) # получаем результаты поиска
    if r.status_code != 200:
        print('Error ' + str(r.status_code) + ' for OGRN=' + str(id))
        return

    # вытаскиваем из страницы нужную нам информацию
    soup = BeautifulSoup(r.content, features='lxml')
    # для начала sanity check, проверим ОГРН на совпадение
    res = soup.find_all('span', id='ogrn')
    ogrn = res[0].contents[0]
    if id != int(ogrn):
        print('Bad data page for OGRN ' + str(id))

    # в этом div-е сосредоточена вся интересующая нас информация
    info = soup.find('div', class_='m-t-5')

    # ищем, действующее предприятие или нет
    status_string = info.find(string=re.compile('Статус'))
    if status_string:
        status_value = status_string.next_sibling.next_sibling.next_sibling.string
        if status_value == 'Действующее':
            working = True

    # проверяем численность работников
    workers_string = info.find(string=re.compile('Среднесписочная численность работников'))
    if workers_string:
        workers_value = workers_string.next_sibling.next_sibling.next_sibling.next_sibling.string
        if int(workers_value) >= 7:
            workers = True

    # проверяем систему налогообложения
    usn_string = info.find(string=re.compile('Упрощенная система налогообложения'))
    if usn_string:
        osn = False

    if working and workers and osn:
        elegible = elegible+1

data = pd.read_excel('200615-reestrot15062020.xls', usecols='C,D', names=['Name', 'OGRN'])
for id in data.OGRN:
    try:
        get_info(id)
    except:
        print('Something went wrong for OGRN ' + str(id))
print('Number of elegible companies ' + str(elegible) + '/' + str(data.OGRN.size))

Запускаем и идем допивать пиво – работает долго, при этом в списке обнаруживается куча странностей – вроде компаний с несуществующими ОГРН; иногда это просто опечатки, типа лишней или забытой цифры, иногда – что-то непонятное. Минцирк оправдывает свое название.

В конечном итоге оказывается, что на льготы могут претендовать всего лишь 3028 компаний из списка (я не разбирал косячные ОГРНы вручную – их у меня набралось 18 штук) – впечатляет, да? В общем, радоваться могут лишь “избранные”, остальных это вряд ли коснется.

Да, оценка несколько завышена – если внимательно почитать требования, необходимые для получения льгот, на сайте министерства, то там обнаружатся дополнительные требования – например, 90% дохода фирма должна получать от “околоайтишной” деятельности (всякого рода Яндексы с Додо-пиццей в пролете):

доля доходов от реализации экземпляров программ для ЭВМ, баз данных, передачи исключительных прав на программы для ЭВМ, базы данных, предоставления прав использования программ для ЭВМ, баз данных по лицензионным договорам, от оказания услуг (выполнения работ) по разработке, адаптации и модификации программ для ЭВМ, баз данных (программных средств и информационных продуктов вычислительной техники), а также услуг (работ) по установке, тестированию и сопровождению указанных программ для ЭВМ, баз данных по итогам отчетного (расчетного) периода составляет не менее 90 процентов в сумме всех доходов организации за указанный период;

Программисты накосячили – и лучше б не исправляли

Оказывается, ютубовские рекламные скрипты наглухо ломаются, если в URL написать доменное имя по всем правилам, с точкой в конце.

Было:

https://www.youtube.com/watch?v=I6n9LNtRItc

Стало:

https://www.youtube.com./watch?v=I6n9LNtRItc

Про народную технику

Довольно забавно, что на всякого рода “интернет-форумах про технику” самые популярные и посещаемые темы посвящены откровенному говну, а большая часть их содержимого – “как сделать из этого говна подобие конфетки“. Счастливые обладатели нормальной техники просто пользуются ей – а решившие всех наебать нищеброды (”знаем-знаем, все делается в одном и том же китае!”) годами варятся в собственном соку, обсуждая “типичные проблемы” – еще один признак того, что производитель ложил известный орган на мнение покупателей.

А вот у яндекса с facial recognition все плохо

Пока вконтакте ищет обнаженные фото ваших знакомых – яндекс запутался в двух Андреях Колесниковых (за наводку спасибо @Mos_art1):

yandex-kolesnikov

Для тех, кто незнаком с реалиями отечественной журналистики – есть Андрей Иванович Колесников из “Коммерсанта” и Андрей Владимирович Колесников из центра Карнеги. Если первый входит в “кремлевский пул” и пишет красиво и иронично – то второй вызывает только рвотный рефлекс.

Хотите еще крипоты про контекстную рекламу?

Ладно там ссылки на тайные телеграм-каналы! Вконтактик сегодня порадовал, аж шишка дымится.

Иногда вконтактик показывает мне в “вы можете их знать” одну из моих учительниц в 8 классе. Это логично – несколько общих “друзей”, почему бы не показать? Но сегодня умные алгоритмы зашли чуть дальше и подкинули мне ее фотосессию с легким ню – фотограф выложил, не указывая, разумеется, модель. Пацаны, если бы мне это показали в 8 классе… (хотя и сейчас очень даже ничего).

Впрочем, загадок тут гораздо меньше – современный facial recognition весьма и весьма продвинут, а совместить “вы можете их знать” и ню-фотосессию – вполне логичный шаг для вконтактика.

И еще про анонимность

Кстати, посмотрел тут на выходных в очередной раз “Профессионала” с Бельмондо и “День Шакала”. Сюжет, в принципе, достаточно близок – симпатичный киллер собирается убить несколько менее симпатичного политика, в процессе водит спецслужбы за нос, и все это на фоне Парижа, где даже бомжи – не какие-то там обыкновенные бомжи, а настоящие французские клошары. “Профессионал” местами похож на веселую комедию, а вот “Шакала” – точнее, его литературный первоисточник – в свое время даже называли руководством для кого-нибудь, желающего скрыть личность. Скажем, описанный в книге способ получения британского паспорта довольно надежно работал вплоть до начала 2000-х (и им прекрасно пользовалось даже КГБ – скажем, паспорта на имя Хитфилда и Фоли были получены именно таким способом).

Вот интересно, нет ли более современных книг, где так же легко и непринужденно описывались бы методы “оперативно-розыскной” деятельности, но в “цифровую” эпоху? Причем для разнообразия хорошо бы представить, что спецслужбы имеют неограниченный доступ к данным всяких гуглов, фейсбуков и яндексов, не говоря уж о сотовых операторах. Подозреваю, что в 2020 году Шакалу пришлось бы куда сложнее.