Как я искал NSFW картинки на Голосе


Если кто не знал, NSFW -- аббревиатура от английского "Not Safe For Work". Используется для обозначения контента, не подходящего для просмотра на рабочем месте. Т.е. контент (картинки, видео, тексты и т.д.), просмотр которого неприемлем в присутствии вашего начальника и/или коллег.
Так же, пару раз слышал вариант расшифровки "Not Safe For Wife", хотя, казалось бы, чего она там такого не видела :)

Обожаю свою работу!

0.05.jpg

В перерывах между инфраструктурными и devops задачами несколько дней инвестировал в исследование возможности использования сверточных нейронных сетей для просмотра порнухи классификации изображений, заливаемых пользователями на Голос.

С помощью нейросетки, обученной на распознавание картинок для взрослых можно сделать на Голосе множество полезных фич: например, автоматически ставить тег NSFW там, где он необходим и где его забыл поставить автор. Или ещё как-то улучшить жизнь человечества...

В любом случае, заниматься порно-картинками гораздо интереснее, чем серверами с linux-ом, и я с радостью взялся за работу :)

Итак, имеем нейросеть на основе Caffe (deep learning фреймворк от Berkley AI Research), тренированную на огромных объемах размеченных изображений, как NSFW, так и обычных SFW ("suitable/safe for work"). Не буду грузить вас скучными техническими подробностями реализации, перейдём сразу к экспериментальной части.

Правда находит NSFW-картинки?

Самый первый вопрос, возникающий у любого экспериментатора -- где деньги, Зин? а покажи-ка нам, любезная нейросеточка, что ты умеешь? Правда можешь хорошо определять NSFW-картинки?

С бескрайних просторов нашего любимого интернета я скачал архив из пятисот NSFW-фоток разного уровня бесстыдства (привет, Роскомнадзор!). Естественно, не удовольствия ради, а работы для! :) И скормил этот архив нашей нейросети. Результаты получились вот такие:

nsfw.png

Поясню. Каждый крестик на графике -- это одно изображение. Каждому изображению после анализа присваивается оценка от 0 до 1. Это вероятность того, что на изображении присутствует что-то пикантное:

  • Оценка от 0 до 0.2: картинка, по мнению нейросетки, является вполне пристойной
  • Оценка от 0.2 до 0.8: картинка явно с "клубничкой", разной степени откровенности
  • Оценка от 0.8 до 1: картинка совершенно точно ПРЯМ ОГОНЬ! :)

Поэтому, увидев распределение вероятностей, я уже было обрадовался -- мол, классно, работает! Всё отлично определяет! Но тут в голову пришла идея внимательно рассмотреть эти пол-тыщи картинок провести эксперимент номер два.

А как на реальных данных?

А натравлю-ка я эту нейросеть на реальные картинки с Голоса. Взял, точно так же, пол-тыщи реальных картинок, залитых реальными пользователями на блокчейн. Результаты получились вот такие:

golos.png

Вроде бы, тоже отличный результат, всё гуд. Большинство картинок уложились в оценку от 0 до 0.2. Но тут любопытство взяло верх :) А давайте посмотрим, что там за картинки получили оценку выше 0.2? Что там за "клубничка" такая у нас на Голосе?

Что возбуждает нашу нейросеть?

Итак, что же возбуждает нашу нейросеть? Я вытащил из сета все картинки с высокими оценками:

hot NSFW images

И вот что обнаружилось:
КЛИКАБЕЛЬНО ДЛЯ ПРОСМОТРА В БОЛЬШЕМ РАЗМЕРЕ

  1. График с двумя выпуклыми пересекающимися кривыми напомнил нейросетке о чём-то пикантном (0.20)
  2. Спящий котик был оценен в 0.28
  3. Эротичное тесто в крепких мужских объятьях пекаря получило оценку 0.36
  4. Фракталы на зелёном фоне возбудили нашу нейросеть сильнее, чем накачанный мужик в белых трусах (0.59 против 0.52)
  5. И мужик в трусах и фракталы проиграли картинке с фразой "Когда у твоего мужа есть биткоины" (0.62)
  6. Обручальные кольца -- это вообще без пяти секунд порно (0.76)
  7. Выпуклости персиков и их косточка были оценены аж в 0.33 и 0.35
  8. При этом, валяющаяся на берегу практически без одежды дама с не менее аппетитными формами была оценена всего в 0.05. Ничего не поделаешь, персики для нашей нейросети более сексуальны :)
  9. И дама и персики вчистую проиграли спящему над клавиатурой очкарику (0.48)
  10. Ну и моё самое любимое, набросок выкройки какой-то игрушки нейросеть посчитала вообще жестким порно и оценила аж в 0.87:
0.87.jpg

Дедушка Фрейд точно был бы рад.

Выводы

Даже страшно представить, что и в каких количествах повидала наша нейросеть в процессе своего обучения и работы, раз её теперь даже такие, казалось бы, обыденные картинки будоражат. Поставлю-ка я ей в целях психологической разгрузки архивчик с фотками котят и миленьких щеночков -- пусть немного расслабится, заслужила. А то ей уже по ночам одни "персики" да "фракталы" снятся, а может и что похуже (выкройка, омг!)

Теперь вот и не знаю, можно ли ей доверить принятие хоть сколько-то серьёзных решений на Голосе. Как вы считаете? :)


Комментарии 16


нейросети пора выдавать молоко за вредность...

14.09.2017 07:08
0

ага, и путёвку в санаторий :)

14.09.2017 07:44
0

Бедняга, пересмотрела...

14.09.2017 07:54
0

Круто!!! Помогите ей развидеть это, загрузите ей котиков что ли.

14.09.2017 08:40
0

Интересный экспериментик. А ещё что-нибудь скармливали сеткам? Было бы интересно почитать.

14.09.2017 08:40
0

Смотрю на выкройку и так, и эдак, и в принципе, понимаю нейросеть. Это похоже на товары из секс-шопа, вот. (заранее извиняюсь, если я кого-то смутила, и да, я хожу в секс-шоп)

14.09.2017 08:49
0

Могли бы и не писать, что Вы ходите в такие места, ведь для того, что бы знать как выглядят оттуда товары, не обязательно туда ходить. ))) Я, вот, например, никогда там не был.))

14.09.2017 09:54
0

@rikimaru в какие-такие? В свободном обществе живем.

14.09.2017 09:56
0

Вы хотите, что бы я об этом прямо написал что ли?))) Конечно в свободном. Они не запрещены. Просто я знаю и без посещения как от туда товары выглядят. ))

14.09.2017 10:51
0

@muhazokotuha Поздравляю! Вы добились некоторого прогресса на Голосе и были награждены следующими новыми бейджами:

Награда за количество полученных голосов

Вы можете нажать на любой бейдж, чтобы увидеть свою страницу на Доске Почета.
Чтобы увидеть больше информации о Доске Почета, нажмите здесь

Если вы больше не хотите получать уведомления, ответьте на этот комментарий словом стоп

Голосуя за это уведомление, вы помогаете всем пользователям Голоса. Узнайте, как здесь.

14.09.2017 08:52
1

Да, прикольно!))


Теперь вот и не знаю, можно ли ей доверить принятие хоть сколько-то серьёзных решений на Голосе.

Как-то даже и не знаю. Сомневаюсь, что можно.)))) Вообще, думаю, над сетью надо ещё поработать. Может внести спектр цветов человеческой кожи. И тот-же спектр, но уже в ЧБ. Точнее это уже будет спектр тонов. Но и выкройка может тогда снова подойти. Сложно!)))

14.09.2017 09:53
0

Это прекрасно. Теперь ей можно доверить выбирать качественный, серьезный контент. 。゚(TヮT)゚。

14.09.2017 11:58
0

Ваш пост поддержали следующие Инвесторы Сообщества "Добрый кит":
knopki, spinner, chiliec, kavalsky, olga-olga, semasping, newodin, vika-teplo, borisss, vadimph, myhardmoney, olgaborisova, wedge, vsebudethorosho, izbushka
Поэтому я тоже проголосовал за него!
Узнать подробности о сообществе можно тут:
Разрешите представиться - Кит Добрый
Правила
Инструкция по внесению Инвестиционного взноса
Вы тоже можете стать Инвестором и поддержать проект!!!


Если Вы хотите отказаться от поддержки Доброго Кита, то ответьте на этот комментарий командой "!нехочу"

15.09.2017 02:58
0

@muhazokotuha Поздравляю! Вы добились некоторого прогресса на Голосе и были награждены следующими новыми бейджами:

Вы получили свою первую выплату
Награда за общую выплату получил

Вы можете нажать на любой бейдж, чтобы увидеть свою страницу на Доске Почета.
Чтобы увидеть больше информации о Доске Почета, нажмите здесь

Если вы больше не хотите получать уведомления, ответьте на этот комментарий словом стоп

Голосуя за это уведомление, вы помогаете всем пользователям Голоса. Узнайте, как здесь.

15.09.2017 14:48
0

@muhazokotuha, Поздравляю!
Ваш пост был упомянут в моем хит-параде в следующих категориях:

  • Голосов - 10 позицию - 56 Голосов
  • Выплаты - 4 позицию - 34,7040 GBG
16.09.2017 06:27
0

что там с хф?)

18.09.2017 10:13
0
Моя страницаНастройкиВыход
Отмена Подтверждаю
100%
Отмена Подтверждаю
Отмена Подтверждаю