От взломщика к хакеру - как журналисты превращают компьютеры в сильных помощников

16 октября 2016 года молодой человек жестоко избил и изнасиловал студентку на берегу реки Драйзам в немецком городе Фрайбург, задушил ее и бросил без сознания в реку, где она утонула. Мужчина во всем признался.

Но он утверждал, что действовал сгоряча и не стал ждать молодых женщин, а случайно встретил ее в 2 часа ночи. По его словам, все это произошло за несколько мгновений. Затем он в панике скрылся с места преступления. Это была история преступника.

Но когда полиция проанализировала зашифрованный мобильный телефон обвиняемого, они обнаружили цифровые следы, которые противоречили этой версии событий. Используя приложение для кардиостимулятора, они смогли доказать, что обвиняемый провел около 30 минут в кустах, прежде чем жертва прибыла на место происшествия. И что гнусный поступок длился целый час. Прошло много времени, прежде чем обвиняемые покинули место преступления. С помощью данных они могли проверить с точностью до секунды, когда мужчина затащил женщину в воду, и даже точное положение, когда он убил ее.

В городе Цюрихе Костас Бекас тоже работает с данными - на более веселую тему. Он является менеджером по основам когнитивных вычислений в IBM Research Zurich. Он возглавляет команду из около 150 человек, которые работают на машинах, предназначенных для помощи врачам в их работе.

Я спросил его, что делают ваши машины. И похоже, что они позволяют ему и его команде обнаруживать рак кожи на ранней стадии, сравнивая миллионы и миллионы изображений кожных заболеваний.

Это вызвало у меня следующий вопрос: так вы работаете над заменой врачей аппаратами?

Это не очень понравилось Костасу Бекасу, греку, не наделенному самым длинным запалом. «Это абсурд», - сказал он. Будущие врачи обязаны пользоваться такими вспомогательными средствами. Ведь по мере старения населения врачей будет пропорционально меньше. Так что им придется работать эффективнее и быстрее. Он добавил, что самое важное во всем развитии искусственного интеллекта - это не сам алгоритм, а то, что именно объясняет врачу, что происходит. Объяснение эксперту, почему система дала определенный результат. И убедиться, что доктор понял, что ему сообщает компьютер.

Врачи, по словам Бекаса, вообще не любят работать с черными ящиками. Хотите понять, как работает система. Он проиллюстрировал это на примере. Он рассказал мне, как недавно продемонстрировал систему врачу в больнице Цюриха. Врач посмотрел на результат диагностики рака кожи, сел за компьютер и начал просматривать в базе данных системы множество изображений, которые он там нашел. Что делаешь? - спросил его Бекас. Врач сказал, что ищет образцы, которые, по-видимому, обнаружил компьютер.

Для этого ему пришлось бы просмотреть до 15 миллионов изображений. Невозможная задача для врача с пациентами. Но эта ситуация иллюстрирует огромную проблему, с которой сталкивается Бекас и его команда специалистов по анализу данных. Им нужно создать не только работающую систему, но и такую, которая будет работать так, как это будет понятно экспертам. Вот почему многие члены этой команды - дизайнеры.

30 мая 2017 года американское издание The Intercept, основанное журналистом Гленом Гринвальдом после дела Сноудена, отправило документ в АНБ, Агентство национальной безопасности США. Это была служебная записка АНБ, из которой следовало, что российская военная разведка взломала электронные урны для голосования незадолго до выборов в США. Скорее всего, безуспешно, но АНБ явно смогло идентифицировать саму атаку.

3 июня прошлого года был арестован 25-летний переводчик, работавший в ВВС США, по имени Reality Winner. Во время работы она наткнулась на отчет, распечатала PDF-файл и анонимно отправила его в The Intercept.

Когда The Intercept затем отправил документ в АНБ для проверки, публикация непреднамеренно раскрыла личность источника. Американский интернет-журнал не учел возможности того, что при более внимательном рассмотрении оригинала документа АНБ могло установить, какой принтер использовался для его распечатки.

Принтеры оставляют на бумаге маленькие желтые точки, похожие на отпечатки пальцев. Расследование АНБ показало, что Виннер был единственным человеком, который мог быть осведомителем. Существуют некоторые разногласия по поводу того, было ли это единственной причиной, по которой АНБ смогло идентифицировать утечку информации.

С тех пор Реалити Виннер была заключена под стражу, где большую часть времени содержится в одиночной камере. С ней обращаются как с предательницей своей страны; дважды ее ходатайства об освобождении под залог были отклонены. Лишь 6 месяцев спустя она смогла обсудить детали своего дела со своим адвокатом. 23 августа Виннер был приговорен к 5 годам и трем месяцам тюремного заключения просто потому, что журналисты Intercept раскрыли свой источник информации Агентству национальной безопасности, хотя им лучше не знать.

Почему я решил пересказать вам эти три анекдота?

Что ж, помимо того факта, что это очень интересные истории сами по себе, они также показывают, что больше нет разницы между цифровым и реальным миром; но что более важно, эти три анекдота иллюстрируют, как журналистам необходимо использовать это слияние цифрового и реального мира для своих исследований. Пример The Intercept показывает, что они даже обязаны это делать. Только так журналисты смогут защитить себя и свои источники.

Прежде всего, журналисты должны узнать, как они могут использовать огромный объем данных, собранных в журналистских целях, для выявления наиболее интересных и актуальных историй. Как полиция во Фрайбурге сделала это, например, взломав расшифровку мобильного телефона и выбрав данные журнала приложения для здоровья.

Разрешено ли журналистам взломать систему?

Цифровой эксперт и юрист Мартин Штайгер не может представить ни одного случая, когда взлом был бы оправдан. Но он не знает ни одного случая в швейцарских СМИ, когда пострадавший подал жалобу на журналистов. Единственные отдаленно сопоставимые случаи касались сообщения о мошенничестве при онлайн-голосовании в кантоне Женева.

В нем участвовал тележурналист, получивший два комплекта бюллетеней после переезда, что позволило ему дважды проголосовать электронным способом. Журналист Жоэль Буассар проверил это и проголосовал дважды. Это сработало. Его голос был засчитан дважды. Фиаско для системы электронного голосования. Эксперимент привел к телевизионному репортажу. Но также побудил генерального прокурора возбудить уголовное дело.

Жоэль Буассар передал дело в Федеральный уголовный суд. Безуспешно. 4 апреля прошлого года Федеральный уголовный суд Беллинцоны оставил в силе решение суда низшей инстанции. Буассар был приговорен к двухдневному сроку заключения условно вместо тюремного заключения плюс штраф в размере 400 франков за фальсификацию результатов выборов. Буассар «взломал» нашу избирательную систему; хотя он не проник в систему, два его голоса засчитывались как манипуляция. Для нашего верховного суда фальсификация результатов голосования имела приоритет над публичной значимостью сообщения об этом.

Для активистов в области конфиденциальности данных это тоже однозначно. В соответствии с действующим законодательством швейцарские журналисты практически не могут заниматься хакерскими атаками, не подвергаясь судебному преследованию. Им приходится проводить свои взломы, например, в таких странах, как Великобритания - там журналисты могут ссылаться на защиту общественных интересов. Или, как полиция во Фрайбурге, поработайте со специалистами по безопасности. Они проводят взлом. И журналисты ссылаются на свое право на защиту своих источников, чтобы скрыть личность эксперта по безопасности. Разумеется, о подстрекательстве не может быть и речи. А глубокие технологические ноу-хау помогают журналистам понять, что возможно и как они могут в любом случае скрыть личность эксперта по безопасности. Чем лучше журналисты разбираются в технологиях, тем лучше.

Второй анекдот, который я упомянул ранее, касается врачей и их недоверия к черным ящикам информатики. В самом деле, нас все чаще окружают алгоритмы, которые обещают нам все под солнцем: они могут диагностировать болезни, или, в случае журналистов, очевидно, скоро смогут писать статьи, или одним нажатием кнопки брать сложные неструктурированные данные для построения. структурированные базы данных, а также создание связей между документами.

Но так же, как врачи не доверяют этим чудодейственным инструментам, так должны поступать и журналисты. Если они не поймут, что делают эти машины, то журналисты и читатели окажутся во власти машин. Но журналисты могут сообщать об алгоритмах только в том случае, если понимают, как они работают.

Когда большинство людей говорят об искусственном интеллекте - или ИИ, как его часто сокращают - они обычно имеют в виду не более чем статистику. В общем, ИИ составляет лишь оценку вероятности того или иного сценария.

Итак, если журналисты понимают, как работают алгоритмы, они могут убить двух зайцев одним выстрелом. Они могут создать свою собственную инфраструктуру для автоматизации некоторых утомительных аспектов работы и генерировать новые идеи для статей. И в то же время они могут использовать новую область отчетности: алгоритмическую предвзятость. Алгоритмы разрабатываются людьми, и в них используются данные, которые также поступают от людей. А люди так или иначе предвзяты.

Что я имею в виду? Возьмем, к примеру, поиск в Google: если вы загуглите «профессиональная стрижка», результаты поиска будут одинаковыми, где бы вы ни находились; и они обычно показывают белых мужчин с великолепной шевелюрой.

Но если вы затем погуглите «непрофессиональная стрижка», вы увидите множество изображений с черными женщинами. У белых мужчин более профессиональные стрижки, чем у черных женщин? Для меня это яркий пример того, как алгоритмы часто подтверждают и укрепляют человеческие предрассудки.

Третий анекдот, о котором я упоминал ранее, касался интернет-безопасности и шифрования. Пример разоблачителя, которого можно было идентифицировать по «отпечатку пальца» на принтере, показывает, что прозрачность, создаваемая Интернетом, ощутима и за пределами Интернета. Все становится отслеживаемым и проверяемым.

В то же время наблюдается заметный контртренд. Инновационные методы шифрования приводят к появлению новых торговых платформ и валют. Я говорю, например, о революции блокчейнов. Блокчейн - это технология, которая составляет основу цифровых валют, которые в последнее время крадут заголовки газет.

Я бы не стал утверждать, что понимаю, как работает технология блокчейн до мельчайших деталей. Лучше всего это сравнить с гигантским бортовым журналом, который копируется на тысячи и тысячи компьютеров. Каждый раз, когда транзакция совершается с использованием биткойнов, эта транзакция остается недействительной до тех пор, пока она не будет внесена как минимум в половину всех журналов.

Принципиально новым в этом является то, что он позволяет людям подключаться друг к другу без посредников - обмениваться товарами и деньгами, не раскрывая свою личность. Поэтому для многих блокчейн рассматривается как технология, которая завершит то, что начал Интернет. Блокчейн наконец-то покончил с посредником. Вам не нужны банки или розничные торговцы между покупателем и производителем. Вы можете общаться друг с другом напрямую. А также анонимно. Еще неизвестно, действительно ли это работает. Интернет также развивался в направлениях, о которых мы даже не догадывались.

Но если журналисты хотят понять блокчейн и осознать преобразующую силу технологии, им поможет, если они отважатся окунуться в мир компьютерных наук и шифрования. Я не думаю, что этого достаточно, чтобы иметь возможность использовать новейшие функции на вашем iPhone. Или быть особенно хорошим пользователем Facebook. Или отправлять особо остроумные твиты. Журналистам необходимо усвоить основы этих технологий, которые меняют нашу жизнь и мир наших СМИ.

А основные зачатки - это языки программирования. Я не говорю, что все журналисты должны стать программистами. То, что мы все пишем, не означает, что мы все романисты. Но, тем не менее, многие люди в современном мире не смогли бы далеко уйти, если бы не умели писать. Думаю, сегодня вы могли бы сказать нечто подобное о цифровизации: есть несколько рабочих мест, которые не принесли бы пользы, если бы те, кто их выполняет, не обладали хотя бы некоторыми базовыми навыками программирования. Журналистика с ее многочисленными специалистами широкого профиля, возможно, одна из профессий, которая могла бы принести наибольшую пользу.

Когда я говорю, что журналисты должны овладевать навыками программирования, коллеги часто кивают головой. Изучите программирование? Как будто у нас мало дел!

Но я вижу много параллелей между журналистами, особенно в журналистских расследованиях, и программистами.

Журналисты-расследователи такие же зануды, как и программисты. Они часто погружаются в предметную область, от которой не могут отказаться, пока полностью не поймут историю во всех ее деталях. До тех пор, пока история, которую они рассказывают, не станет действительно осмысленной.

Любые журналисты, которые проводят тщательное исследование, действительно удовлетворены только тогда, когда они понимают каждый шаг в истории. Программисты также настойчивы в своей работе. Они возятся и возятся со своим компьютерным кодом столько времени, сколько требуется, прежде чем он заработает.

И программистам, и журналистам-расследователям также приходится бороться со стереотипом, который давно устарел. А именно, идея, что они проводят большую часть своей работы над своими историями или компьютерными кодами в одиночку и часто не разговаривают ни с кем в течение нескольких дней. Это уже не относится к журналистам-расследователям. Это только недавно было продемонстрировано в исследованиях, проведенных в «Райских бумагах». Масштаб и влияние этого исследования никогда не были бы возможны, если бы исследователи не были объединены в сеть и постоянно обменивались информацией.

Именно так работает и программист. Они постоянно обмениваются идеями и информацией друг с другом с помощью своих компьютерных кодов.

Всем рекомендую взглянуть на онлайн-платформу Github. Github - крупнейшая точка сбора компьютерного кода и программного обеспечения с открытым исходным кодом в Интернете. Платформа позволяет тысячам разработчиков асинхронно работать над одними и теми же проектами. Исходный код библиотеки машинного обучения под названием scikit-learn, например, можно найти примерно в каждом втором алгоритме искусственного интеллекта. Весь код размещен на Github, где он находится в свободном доступе для просмотра. Над этим программным комплексом работали более сотни программистов со всех уголков мира.

Еще одна общая черта программистов и журналистов - это метод работы, а именно документация. Хорошая и подробная документация так же важна для журналиста-расследователя, как и для программиста. Поскольку оба часто работают с очень сложными эксклюзивными материалами, важно сформулировать каждый шаг - в большинстве случаев в хронологическом порядке. Если все не будет собрано в письменной форме и не будет хорошо организовано, впоследствии будет невозможно понять, как появился код или как можно просто и правильно передать результаты исследований.

Исследования носят творческий характер. И очень сильно движима заинтересованным лицом. Я не знаю ни одного коллеги-исследователя, чей метод работы действительно можно было бы сравнить с другим. Конечно, есть инструкции, как выделить в интервью наиболее важную информацию из источника. Но в основном у каждого своя методика исследования.

То же самое и с программистами. Удивительно наблюдать, как разные люди находят разные подходы к решению задач программирования. Даже среди людей, которые только что выучили несколько базовых команд языка программирования.

И, конечно, есть различия между журналистами и программистами. Возможно, самая большая разница в результате. Когда код программиста не подходит для решения проблемы программирования, результата нет. То же самое не относится к работе журналиста. Здесь всегда есть результат исследования. Хороший ли он и подходит ли он для рассказа - другой вопрос.

Любой, кто изучает программирование, быстро забывает, что есть люди, которые не понимают, как работает кодирование. Это немного похоже на обучение катанию на велосипеде. Велосипедистам трудно понять, как нельзя ездить на велосипеде. Это приводит к определенному разрыву между программистами и журналистами. Журналисты должны приобрести некоторые базовые навыки программирования, чтобы восполнить этот пробел и понять, как кодирование можно использовать не только для исследований, но и для журналистских форм и продуктов.

Например, журналисты-программисты могут создавать свои собственные простые индивидуальные программы. С помощью нескольких строк кода вы можете отследить самолет диктатора, когда он входит в воздушное пространство Швейцарии; или за считанные секунды выполните поиск по всем постановлениям швейцарских судов, когда-либо опубликованных в Интернете, на наличие определенных шаблонов, используя дешевый ноутбук; или построить небольшого робота, который сообщит вам, когда предприниматель доводит свою следующую компанию до банкротства.

Когда ситуация становится более сложной - например, когда вы хотите исследовать, какие политики по каким вопросам склоняются вправо или влево, - вы знаете, к каким экспертам следует обратиться, чтобы прийти к единым ответам.

Вернемся на мгновение к аналогии с велоспортом: журналистам не нужно планировать Тур де Франс; они могут достаточно быстро добиться успеха, обладая базовыми навыками езды на велосипеде. Но в этот цифровой век журналисты сегодня должны найти время, чтобы научиться ездить на велосипеде. И им также должны предоставить время их работодатели.

Короче говоря: для издателя нет лучшего вложения в журналистику, чем дать журналистам время и возможность обучиться искусству программирования. Результатов три: во-первых, качественная журналистика, за которую читатели готовы платить; во-вторых, большая эффективность, поскольку журналист может автоматизировать очень конкретную повторяющуюся работу; и, в-третьих, журналист также попутно разрабатывает структурированные данные и идеи для новых журналистских форм, которые могут использовать возможности новых медиа и платформ.

материалы по теме:

Новые материалы

Игра в прятки с данными

Игра в прятки с данными Я хотел бы, чтобы вы сделали мне одолжение и ответили на следующие вопросы. Гуглить можно в любое время, здесь никто не забивается. Сколько регионов в Гане? А как..

«Раскрытие математических рассуждений с помощью Microsoft MathPrompter и моделей больших языков»

TL;DR: MathPrompter от Microsoft показывает, как использовать математические рассуждения с большими языковыми моделями; 4-этапный процесс для улучшения доверия и рассуждений в математических..

Раскройте свой потенциал в области разработки мобильных приложений: Абсолютная бесплатная серия

Глава 6: Работа в сети и выборка данных Глава 1: Введение в React Native Глава 2: Основы React Native Глава 3: Создание пользовательского интерфейса с помощью React Native Глава 4:..

Все о кейсах: Camel, Snake, Kebab & Pascal

В программировании вы сталкивались с ними при именовании переменной, класса или функции. Поддержание согласованности типов и стилей случаев делает ваш код более читабельным и облегчает совместную..

Как работает дистанционное парное программирование и почему оно может изменить вашу жизнь

Серебряная пуля от одиночества и отвлекающих факторов во время обучения программированию Независимо от того, работаете ли вы или учитесь удаленно, велика вероятность, что одиночество и..

🔥🔥👉Питон 🆚Javascript👈🔥🔥

Сегодня Python и Javascript потрясают мир в области ИТ. Все хотят выучить Python и Javascript, чтобы получить высокооплачиваемую работу. Различные фреймворки Python и Javascript расширяют..

Понимание трансферного обучения для медицинской визуализации

Трансферное обучение (также известное как предварительное обучение ImageNet) — это обычная практика глубокого обучения, когда предварительно обученная сеть точно настраивается на новый набор..

Machine Learning JavaScript Data Science Artificial Intelligence Software Development Python Web Development Coding Deep Learning AI React Software Engineering Nodejs Java Front End Development Typescript Computer Science Tech Javascript Development Javascript Tips Cybersecurity Data Development Learning Angular Algorithms ChatGPT Productivity Golang Neural Networks CSS NLP Developer Startup Vuejs Reactjs Reinforcement Learning Computer Vision