Что могут нейросети сегодня с примерами — статья — рассуждение

Что могут нейросети

Введение

Не слишком большим преувеличением будет сказать, что в мире за последние пару лет произошла настоящая революция. Это революция Искусственного Интеллекта. Она уже третья по счету, считая с эры появления персональных компьютеров и изобретения Интернета.

Искусственный интеллект ворвался в жизнь людей с ошеломительной скоростью.

Он нашел себе «работу» буквально повсюду.

Эта статья не ставит своей целью сделать обзор всех существующих нейросетей с подробными характеристиками, это скорее рассуждение о том, что умеет Искусственный Интеллект сейчас и к чему стоит приглядеться, но в ней встретится немало громких имен и названий самых интересных и популярных нейросетей.

Материал статьи будет особенно актуален в обозримом будущем примерно 2-3 года, далее я прогнозирую еще более бурное развитие нейросетей. Впрочем, возможности ИИ, описанные в материале, никуда не исчезнут. В статье я привожу личный опыт создания видеоклипа в нейросетях и описание некоторых функций известных нейронок.

Нейросеть генерирует картинки

Нейросети рисуют подобно художникам

Чрезвычайно впечатляют достижения ИИ в сфере создания изображений. Буквально за несколько секунд стало возможным получить качественные картинки, созданные по запросу, и не в одном, а сразу в нескольких вариантах. Обучившись «рисовать» на огромном массиве данных, нейросети научились повторять за художниками-людьми.

Но сами люди зачастую от этого не в восторге, ведь многие из них стали получать намного меньше заказов, и действительно, зачем платить художнику, когда все можно получить бесплатно или за символическую плату, причем не нужно вносить долгие правки в работу — все получается само собой, лишь стоит детальней уточнить запрос?

Индустрия так уверенно развивается, что, пожалуй, «выживут» и останутся востребованными только самые креативные и плодовитые художники.

Среди особенно популярных нейросетей для рисования можно назвать Midjourney, которая создает насыщенные картины со вниманием к деталям, Flux — мощный и гибкий инструмент, создающий красочные картинки, Stable Diffusion – популярную нейросеть с открытым исходным кодом, которая рисует изображения в достойном качестве. Большой популярностью пользуется нейросеть Recraft, где можно создавать векторные и растровые изображения, иконки и логотипы.

Мой личный опыт генерации изображений и создания видео в нейросетях — музыкальный видеоклип

Вызывают интерес возможности нейросетей для создания видео. Особенно колоритно и стильно выглядят работы двух нейросетей в связке — одна рисует изображение, а другая «оживляет» его.

Одним из примеров такой работы может быть видео, созданное во Flux и Kling – в одном нарисованы картинки, а в другом сделана их анимация. Это видеоклип на футуристическую композицию Smart Cat – The New Times, вдохновением для которой послужили успехи в развитии Искусственного Интеллекта.

Вот клип:

Также можно послушать и скачать композицию отдельно — ВК, Яндекс Музыка, iTunes, Apple Music, Spotify и другие платформы.

Лично меня очень впечатлило качество генерации видео в нейросети Kling AI Pro, она справилась с задачей намного лучше, чем другие нейросети, такие, как Runway ML и Luma Dream Machine. Впрочем, в умелых руках, все они будут работать неплохо, в сети можно найти достойные работы в каждой из них, и раскрыто, на что способна каждая нейросеть. Для меня было также важным получить на выходе видео в формате 16:9 в разрешении 1920×1080, и версия Kling 1.6 Pro позволяет это сделать, это одна из лучших нейросетей, которые оживляют фото. В последнее время на сайте Freepik.com, где производилась анимация, также появилась функция увеличения качества видео вплоть до 4K.

Расскажу немного о создании клипа «The New Times».

Первое с чего началось создание — генерация картинок — футуристических модных девушек, пейзажей фантастического будущего, полета космических кораблей и кают на звездолетах с видами космоса.

Для этого пришлось повозиться. Неоценимую помощь в создании картинок оказал сервис piclumen.com, где во Flux 1 Schnell совершенно бесплатно были сгенерированы сотни изображений и выбраны лучшие. Правда последнее обновление на сайте урезало количество бесплатных генераций до 50 в сутки, но сервис по-прежнему остается хорошим рабочим инструментом.

Стоит сказать, что Flux обладает хорошим качеством, и он мне нравится даже больше, чем считающийся эталоном Midjourney или Stable Diffusion. Впрочем, версии всех нейросетей для рисования постоянно обновляются и поэтому они могут делать свое дело все лучше и лучше. Помимо Flux на сайте также представлены другие собственные нейросети.

При этом стоит отметить, что Flux 1 Schnell требует очень точных запросов для хорошего результата, и далеко не с первого раза получается именно то, что хочется. Я также пробовал генерировать в более старших моделях Flux и результаты мне понравились. Как бесплатные, так и платные версии этой нейросети для генерации изображений заслуживают внимания.

Вот две из сгенерированных картинок, достойные, но не вошедшие в окончательную версию клипа:

Что могут нейросети - создание изображений
Что могут нейросети - генерация изображений

Чтобы получить хорошую картинку, стоит учиться создавать промты — подсказки. Моя основная рекомендация, чтобы работы получались яркими и «цепляющими» — максимальная конкретность запроса. Нужно подробно описать персонажа, которого хотите видеть, окружение с деталями, стилистику.

К примеру: «Прямоходящий кот в модном деловом костюме и модных очках стоит у футуристического сферического бело-синего здания с круглыми окнами, солнечный день, мягкое освещение, в небе с облаками летит большой красный воздушный шар». По желанию можно дополнять запрос все более точными деталями. Стилистика персонажей, предметов и окружения может быть, например: картина стиль Рафаэля, киберпанк, стимпанк, Unreal Engine. Внимание также можно обратить на камеру — селфи, портрет. При использовании сервиса piclumen.com лучше вводить запрос на английском языке, с качественным переводом хорошо справляется переводчик DeepL.com

Генерация видео производилась в AI разделе сервиса Freepik.com в котором можно выбрать разные нейросети для создания видео.

Отдельно стоит похвалить Freepik.com за автоматическое создание запросов к нейросети, когда загружаешь картинку перед ее оживлением. Совершенно чудесным образом подсказки-промты автоматически генерируются, ясно и точно понимая, что именно изображено на картинках и красочно это описывая с добавлением интересного развития действий в видео.

Это также является наглядной демонстрацией того, что уже умеют нейросети — детально понять и описать изображение и креативно предложить его анимацию. Далее вы можете выбрать, что делать — оставить запрос как есть, изменить его, добавив свою изюминку, или написать полностью самостоятельно. С хорошими подсказками не нужно долго ломать голову, как оживить фото с помощью нейросети.

Для работы я попробовал разные нейросети, но моим однозначным выбором стал Kling 1.6 Pro. С недавнего времени Freepik также добавил в коллекцию к уже представленным другую нейросеть, которая делает видео — Google Veo 2, но я не тестировал ее, возможно, она достойно справляется со своими задачами.

Если вы вдохновились создать собственный клип, то хочу вас предупредить, что piclumen.com при соотношении картинок 16:9 создает изображения в разрешении 1344×768, поскольку видео в моем случае должно было быть в Full HD, каждое изображение я масштабировал до 1280×731 и обрезал, чтобы получить 1280×720 и потом делал Upscale – кратное увеличение картинки без потери качества (я делал x4). Upscale можно сделать прямо во Freepik или на сторонних сервисах. Можно и не обрезать и не масштабировать, но какой будет результат сказать трудно, больше контроля получаешь, когда наглядно понимаешь, что будет анимироваться.

Искусственный Интеллект стал мощнее благодаря машинному обучению

    Одно из самых главных направлений, где без Искусственного Интеллекта не обойтись – индустрия компьютерных игр.

    Были времена, когда ИИ приходилось ругать. Боты в играх были слишком медлительны, глупы, и особенной популярностью пользовались игры, в которых они могли проявлять себя интересней и живее, создавая атмосферу маломальского экшена.

    Теперь же, с развитием ИИ, игровая индустрия получила новый импульс, и игры станут более интересными и совершенными.

    Для того чтобы чудеса Искусственного Интеллекта стали реальностью, ученые создают компьютерные алгоритмы, способные воспринимать информацию, обучаться и меняться, это то, что принято называть машинным обучением.

    Специалисты, занятые в процессах этого обучения — одна из перспективных профессий будущего. Более подробно о ней и о других профессиях, которые будут особенно востребованы, я написал отдельную статью — Топ-10 Профессий будущего.

    Чат-бот

    Виртуальный собеседник и поиск в Интернете — Большая языковая модель

    Говоря о нейросетях, нельзя пройти мимо самых впечатляющих чат-ботов, с именами которых во многом и связана ИИ-революция. Первой нейросетью, нашумевшей на весь мир, был ChatGPT. Когда он только вышел, было просто удивительно и поразительно, что он может общаться с человеком, поддерживая беседу и отвечая на любые вопросы.

    Его новый конкурент от китайской компании DeepSeek при выпуске обширного обновления обвалил акции технологических компаний, ведь мощнейший ИИ, сравнимый с ChatGPT, доступен в бюджетной версии.

    Большие языковые модели или Large language models, к которым относится ChatGPT, DeepSeek, Claude, GigaChat от «Сбера», YandexGPT и другие известные и малоизвестные нейросети — это собеседники, которые могут помочь почти во всем.

    Нейросети легко и непринужденно пишут текст. Благодаря запросу в языковую модель, к примеру, можно сочинить рассказ, причем он будет обладать достаточно высокой связностью, будет логичным и даже в определенной степени креативным.

    Например, можно задать параметры, что рассказ будет о супергерое, и пусть нейросеть сама опишет 4 его главных сверхспособности, 2 слабости, где он живет и чего хочет достичь, кто его главный оппонент и какие приключения его ждут, кто его вторая половинка и не хочет ли кто-то встать на пути его счастья, каким будет финал и намек на продолжение. Все это, при правильном запросе человек получит за несколько секунд.

    Нашумела забастовка американских сценаристов в 2023 году, направленная против повсеместного использования ИИ, ведь их профессия, и даже профессии актеров и режиссеров уже не такие незаменимые.

    В чат можно задать вопрос сколько калорий потратит человек при определенной диете и занятии конкретными упражнениями, он с легкостью создать таблицу на 30 дней занятий вперед.

    Входными данными для подобного рода нейросетей могут быть не только текстовые сообщения, но и картинки и речь, звук и видео. К примеру, человек может показать нейросети ролик с математической задачей, и ИИ объяснит его. Нейросети научились понимать эмоции, в качестве демонстрации было показано, как ChatGPT, заметив радостное выражение лица собеседника, предположил, что у кого-то День Рождения и предложил спеть веселую песню в честь именинника.

    Интересны ответы с использованием ИИ функции «Глубокого мышления» (Deep Think).

    Так, сделав запрос к DeepSeek с включенной функцией о том, когда появилось понятие кармы, нейросеть начала рассуждать о том, что карму можно понимать по-разному, и в индуизме, буддизме и джайнизме есть отличия в ее определении. В конце ответа ИИ выдал сводную таблицу с выжимкой, что такое карма в этих религиях, а по ходу рассуждения дал верные ответы о хронологическом появлении понятия.

    Для многих пользователей будет немаловажно, что нейросетью DeepSeek c «Глубоким мышлением» можно воспользоваться бесплатно.

    Языковые модели способны программировать и решать массу других задач, избавляя человека от рутины и невероятно ускоряя получение нужных результатов.

    Нейросети отлично справляются с поиском информации в Интернете, их можно попросить поискать необходимое, и они легко найдут ответ с указанием источников.

    Новым словом в поиске информации стало появление Perplexity AI — поисковой сети и чат-бота, который сканирует данные Интернета и выдает точные детальные ответы на запросы пользователей особенно совершенно. Многие даже сочли, что обычные поисковики больше не нужны, когда в руках есть такой инструмент.

    Нейросети помогают в работе

    Искусственный Интеллект и человек смогут ли нейросети обладать сознанием?

    Интересным вопросом является сможет ли человек когда-нибудь создать такой Искусственный Интеллект, который бы ничем не отличался по возможностям от человеческого и обладал сознанием.

    Существуют разные точки зрения на этот счет. Известный британский физик и математик, лауреат Нобелевской премии по физике за 2020 год сэр Роджер Пенроуз давно размышляет об Искусственном Интеллекте.

    По его мнению ИИ и человеческий интеллект очень сильно отстоят друг от друга, ученый считает, что человеческий разум содержит в себе фундаментальную невычислимость, а значит и невозможно будет создать ИИ, такой же как у человека, пользуясь математическими методами.

    Никакие компьютерные модели не создадут сознание, которым обладают лишь люди, уверен Пенроуз.

    Другие напротив мечтают о наступлении эры, когда человеческое сознание можно будет переместить на цифровой носитель и тем самым покончить с проблемой старения и смерти.

    Одно можно сказать с уверенностью — Искусственный Интеллект, который решает множество задач, которые раньше были под силу лишь людям, это уже наступившее будущее, и дальше ИИ будет становиться только умнее и совершеннее. В будущем у людей должно появиться больше свободного времени для творчества и развлечений.

    Нейросеть создает песни

    Как заработать на нейросетях – Шоу-бизнес

    Говоря о возможностях ИИ сегодня, нельзя обойти стороной индустрию создания музыкального контента.

    Лично я не рассматриваю возможность написания музыки сторонними сервисами, поскольку, мне, как композитору, нравится самому сочинять мелодии, но я не вижу ничего плохого, если кто-то креативно создает ИИ-музыку и зарабатывает на этом.

    Один из вариантов заработать при помощи нейросетей и при этом почувствовать себя настоящим продюсером и режиссером из мира шоу-бизнеса – создать виртуальную певицу, сочинить для нее песни и сгенерировать музыкальные клипы с ее участием.

    Большой популярностью пользуется нейросеть Suno AI, в которой можно написать песню с помощью искусственного интеллекта или создать композицию практически в любом жанре. Возможности и качество генерации нейросети растет с каждым новым апдейтом.

    Для того чтобы в клипах была одна и та же женщина, нейросеть нужно «натренировать» — создать обширные фотосессии — они станут основой будущих клипов с виртуальной певицей.

    Для синхронизации движения губ при пении можно использовать функцию Lip Sync в генераторе видео.

    Для полного производства клипов вполне подойдет связка Flux – генерация картинок, Suno – песни, Kling Pro – видео. Можно использовать и другие нейросети, принцип создания остается одним и тем же.

    Создать певицу — интересное и креативное занятие, она может стать узнаваемой и популярной и принести в мир нечто новое и оригинальное. Конечно, далеко не каждому получится выйти на хороший заработок, но если подойти к делу с хорошим планом, творческой энергией и предпринимательским напором, все может получиться, талантливо созданные в Suno песни и каверы набирают миллионы просмотров.

    Мы поговорили о некоторых возможностях ИИ на сегодня и самых передовых нейросетях, уверен, что в будущем они смогут делать невообразимые сейчас вещи и нас ждет много интересного! Остается только следить за технологиями и приобретать навыки их применения.

    Надеюсь статья была полезна для вас, и может быть вы воспользуйтесь какой-то из нейросетей для работы или развлечения.

    Ваш кот Снежок.

    Эрудиция - Интересный блог кота Снежка
    Понравилась статья? Поделиться с друзьями