How to make trollge voice
How to make trollge voice
5 Best Real Time Voice Changer For Discord, Skype, Steam Gaming Trolling
Do you want to sound like Lucifer or Satan when gaming? The best way to troll online is to mask your voice, imagine being the best counter strike player with a kid voice. These software are ideal for trolling with online games such as PUBG (Players Unknown Battleground), LOL (League of Legends), Minecraft (troll like a boss) or Fortnite.
As shown in the video above, a voice changer is capable of altering the pitch and timbre of the user’s voice, applying special effects, and performing graphic equalization almost in real-time. Based on my own experience trolling online when playing dota, these software works better when you have a dedicated sound card or a good microphone such as Blue Yeti with noise cancellation and better voice processor.
↓ 01 – VoiceMeeter | Free | Windows
Voicemeeter is more of an Audio Mixer, however, it can be used to increase or reduce the pitch of your voice too. Audio Mixer Application endowed with Virtual Audio Device used as Virtual I/O to mix and manage any audio sources from or to any audio devices or applications. For End User / Home Users, Voicemeeter is free to use! You pay what you want when you want if you find it useful.
Voicemeeter is a Unique Application designed for everyone willing to manage audio in a smart way! For VOIP users, Broadcasters, Podcasters, Video gamers, Musicians, DJ’s and whatever Sound Lovers, P.A. System tweaker, Home-Cinema audiophiles…
↓ 02 – Clownfish Voice Changer | Free | Windows
Clownfish Voice Changer is an application for changing your voice. It’s installed on system level so every application that uses a microphone or other audio capture device will be affected. In general – your voice will be modified in Steam, Skype, Hangouts, ooVoo, Viber, Ekiga, Jitsi, Ventrilo, TeamSpeak, Mumble, Discord, etc.
Voice effects list: Alien, Atari, Clone, Mutation, Fast Mutation, Slow Mutation, Male pitch, Silence, Female pitch, Helium pitch, Baby pitch, Radio, Robot, Genji, JigSaw, Optimus Prime, Darth Vader, Transformer, and also Custom pitch. The ultimate system wide voice changer for Microsoft Windows 10.
↓ 03 – Voicemod | 7 Random Voice Free Per Day | USD15 | Windows
Voicemod is the best free voice changer software for Windows (coming soon for Linux and macOS). It is an online voice modifier with effects capable of converting your voice into robot, deep satanic, female or girl online. It’s great for games and chatting as an app. Voicemod is compatible with almost all the communication and streaming software available in the market: Discord, Skype, Twitch, TeamSpeak, Steam (dota, counter strike or more), OBS, Hangouts, Bebo and more…
↓ 04 – MorphVOX | Free With Limited Voices | USD30Windows | Mac
MorphVOX Junior is free voice changer software that will modify your voice to match your personality. You can sound like a man, woman, or little folk. Built-in voices and sound effects make this voice changer so convenient to use. MorphVOX Pro will change your voice online and in-game. Take your voice-changing to a new level with superior voice-learning technology, background cancellation, and sound quality. Why you should use this voice changer:
↓ 05 – Voxal Voice Changer | Free For Home User | USD15 | Windows | macOS
Modify, change and disguise your voice in any application or game that uses a microphone to add another dimension of creativity. From ‘Girl’ to ‘Alien’, the voice changing options are limitless. A free version of Voxal voice changing software is available for non-commercial use only. If you will be using Voxal at home.
↓ 06 – Voice Changer Software Basic | Not Free, Trial Available | USD30 | Windows
Easily access and modify every characteristic of your voice. Your voice will sound deeper, higher, younger, older, more feminine, more masculine, or modified in any way you like; you’re in charge. Thanks to the diversity of voice preferences and voice effects, each setting combination you create defines a truly unique voice that you can save and access at any time, or update/modify as you like.
Numerous advanced voice effects and voice filters are available within the program: 30 Voice Effects, 70 Background Effects, 17 Non-human Voices, 40 plug-in Audio Effects and more.
Качественная озвучка текста онлайн
У нас самая дешевая и наиболее продвинутая озвучка в интернете, и вот почему!
Мы поддерживаем более 500 разных голосов, примеры которых Вы можете послушать. Только на нашем сайте Вы сможете озвучивать длинные тексты, создавать диалоги и даже редактировать голоса!
Символы для озвучки оплачиваются токенами
Тут будет ваша аудиодорожка
Мощный онлайн синтезатор речи UniTools подойдет для преобразования текста любой длины и сложности в голос. Вы можете выбрать один из широкого спектра голосов и легко его настроить под свои задачи. В итоге Вы увидите красивую аудиозапись, озвученную мужским или женским голосом. Онлайн озвучка текста производится голосами, которые легко спутать со звучанием речи живого человека.
Сервис реалистичной и качественной озвучки текста голосом («читалка» или «говорилка») от UniTools может пригодится Вам при озвучке роликов, книг, инструкций, рекламы, создании техники или даже собственного голосового ассистента (у нас есть API для этого). Полученные аудиодорожки с легкостью заменят настоящего человека при озвучке ролика, книги или лекции, причем обойдутся во много раз дешевле.
Озвучка текста UniTools значительно расширяет возможности для ведения каналов в соцсетях. Сервис для прочитывания текста голосом помогает создавать качественные аудио и видео ролики тем, кто не хочет покупать дорогостоящее оборудования для записи голоса или недоволен его звучанием.
Сервис UniTools позволяет озвучивать тексты любой длины, что особенно удобно для записи объемных роликов. Количество символов ограничено только Вашим балансом.
При озвучке объемных текстов все роботы порой ошибаются (неверно ставят ударения или паузы). В таком случае Вам придется исправить неверный фрагмент, уточнив его для робота. На любых других сервисах озвучки Вам придется переозвучить весь текст, даже если бОльшая его часть не изменилась. Но на UniTools мы запомниаем каждый озвученный фрагмент, чтобы затем его можно было вновь использовать совершенно бесплатно! И даже если Вы решите поэксперементировать с голосом и зададите ему другие скорость и/или высоту, то деньги со счета не спишутся.
Синтез речи от UniTools объединяет в себе голоса от самых разных производителей со всего мира. Благодаря этому мы уже сейчас можем предоставить Вам более 500 разных голосов, говорящих на большинстве популярных языков мира: русском, английском, казахском, украинском, итальянском, испанском, французском, немецком и множестве других.
Многоязычный синтез речи с клонированием
Хотя нейронные сети стали использоваться для синтеза речи не так давно (например), они уже успели обогнать классические подходы и с каждым годам испытывают на себе всё новые и новый задачи.
Например, пару месяцев назад появилась реализация синтеза речи с голосовым клонированием Real-Time-Voice-Cloning. Давайте попробуем разобраться из чего она состоит и реализуем свою многоязычную (русско-английскую) фонемную модель.
Строение
Наша модель будет состоять из четырёх нейронных сетей. Первая будет преобразовывать текст в фонемы (g2p), вторая — преобразовывать речь, которую мы хотим клонировать, в вектор признаков (чисел). Третья — будет на основе выходов первых двух синтезировать Mel спектрограммы. И, наконец, четвертая будет из спектрограмм получать звук.
Наборы данных
Для этой модели нужно много речи. Ниже базы, которые в этом помогут.
Имя | Язык | Ссылка | Комментарии | Моя ссылка | Комментарии |
---|---|---|---|---|---|
Словарь фонем | En, Ru | En,Ru | link | Совместил русский и английский фонемный словарь | |
LibriSpeech | En | link | 300 голосов, 360ч чистой речи | ||
VoxCeleb | En | link | 7000 голосов, много часов плохого звука | ||
M-AILABS | Ru | link | 3 голоса, 46ч чистой речи | ||
open_tts, open_stt | Ru | open_tts, open_stt | много голосов, много часов плохого звука | link | Почистил 4 часа речи одного спикера. Поправил аннотацию, разбил на отрезки до 7 секунд |
Voxforge+audiobook | Ru | link | много голосов, 25ч разного качества | link | Выбрал хорошие файлы. Разбил на отрезки. Добавил аудиокниг из интернета. Получилось 200 спикеров по паре минут на каждого |
RUSLAN | Ru | link | Один голос, 40ч чистой речи | link | Перекодировал в 16кГц |
Mozilla | Ru | link | 50 голосов, 30ч нормального качества | link | Перекодировал в 16кГц, Раскидал разных пользователей по папкам |
Russian Single | Ru | link | Один голос, 9ч чистой речи | link |
Обработка текста
Первой задачей будет обработка текста. Представим текст в том виде, в котором он будет в дальнейшем озвучен. Числа представим прописью, а сокращения раскроем. Подробнее можно почитать в статье посвященной синтезу. Это тяжелая задача, поэтому предположим, что к нам поступает уже обработанный текст (в базах выше он обработан).
Следующим вопросом, которым следуют задаться, это использовать ли графемную, или фонемную запись. Для одноголосного и одноязычного голоса подойдет и буквенная модель. Если хотите работать с многоголосой многоязычной моделью, то советую использовать транскрипцию (Гугл тоже).
Для русского языка существует реализация под названием russian_g2p. Она построена на правилах русского языка и хорошо справляется с задачей, но имеет минусы. Не для всех слов расставляет ударения, а также не подходит для многоязычной модели. Поэтому возьмём созданный ей словарь, добавим словарь для английского языка и скормим нейронной сети (например этим 1, 2)
Прежде чем обучать сеть, стоит подумать, какие звуки из разных языков звучат похоже, и можно им выделить один символ, а для каких нельзя. Чем больше будет звуков, тем сложнее модели учиться, а если их будет слишком мало, то у модели появиться акцент. Не забудьте ударным гласным выделять отдельные символы. Для английского языка вторичное ударение играет малую роль, и я бы его не выделял.
Кодирование спикеров
Сеть схожа с задачей идентификации пользователя по голосу. На выходе у разных пользователей получаются разные вектора с числами. Предлагаю использовать реализацию самого CorentinJ, которая основана на статье. Модель представляет собой трехслойный LSTM с 768 узлами, за которыми следует полносвязный слой из 256 нейронов, дающие вектор из 256 чисел.
Опыт показал, что сеть, обученная на английской речи, хорошо справляется и с русской. Это сильно упрощает жизнь, так как для обучения требуется очень много данных. Рекомендую взять уже обученную модель и дообучить на английской речи из VoxCeleb и LibriSpeech, а также всей русской речи, что найдёте. Для кодера не нужна текстовая аннотация фрагментов речи.
Тренировка
Синтез
Перейдём к синтезу. Известные мне модели не получают звук напрямую из текста, так как, это сложно (слишком много данных). Сначала из текста получается звук в спектральной форме, а уже потом четвертая сеть будет переводить в привычный голос. Поэтому сначала поймём, как спектральное вид связанна с голосом. Проще разобраться в обратной задаче, как из звука получить спектрограмму.
Звук разбивается на отрезки длинной 25 мс с шагом 10 мс (по умолчанию в большинстве моделей). Далее с помощью преобразования Фурье для каждого кусочка вычисляется спектр (гармонические колебания, сумма которых даёт исходный сигнал) и представляется в виде графика, где вертикальная полоса — это спектр одного отрезка (по частоте), а по горизонтальной — последовательность отрезков (по времени). Этот график называется спектрограммой. Если же частоту закодировать нелинейно (нижние частоты качественнее, чем верхние), то изменится масштаб по вертикали (нужно для уменьшения данных) то такой график называют Mel спектрограммой. Так устроен человеческий слух, что небольшое отклонение на нижних частотах мы слышим лучше, чем на верхних, поэтому качество звука не пострадает
Существует несколько хороших реализаций синтеза спектрограмм, такие как Tacotron 2 и Deepvoice 3. У каждой из этих моделей есть свои реализации, например 1, 2, 3, 4. Будем использовать(как и CorentinJ) модель Tacotron от Rayhane-mamah.
Tacotron основан на сети seq2seq с механизмом внимания. Ознакомитесь с подробностями в статье.
Тренировка
Не забудьте отредактировать utils/symbols.py, если будете синтезировать не только английскую речь, hparams.pу, а так же preprocess.py.
Для синтеза нужно много чистого, хорошо размеченного звука разных спикеров. Здесь чужой язык не поможет.
Вокодер
Теперь осталось только преобразовать спектрограммы в звук. Для этого служит последняя сеть — вокодер. Возникает вопрос, если спектрограммы получаются из звука с помощью преобразования Фурье, нельзя ли с помощью обратного преобразования получить снова звук? Ответ и да, и нет. Гармонические колебания, из которых состоит исходный сигнал, содержат как амплитуду, так и фазу, а наши спектрограммы содержат информацию только об амплитуде (ради сокращения параметров и работаем со спекрограммами), поэтому если мы сделаем обратное преобразование Фурье, то получим плохой звук.
Для решения этой проблемы придумали быстрый алгоритм Гриффина-Лима. Он делает обратное преобразование Фурье спектрограммы, получая «плохой» звук. Далее делает прямое преобразования этого звука и получают спектр, в котором уже содержится немножко информации о фазе, причём амплитуда в процессе не меняется. Далее берётся еще раз обратное преобразование и получается уже более чистый звук. К сожалению, качество сгенерированной таким алгоритмом речи оставляет желать лучшего.
На его смену пришли нейронные вокодеры, такие как WaveNet, WaveRNN, WaveGlow и другие. CorentinJ использовал модель WaveRNN за авторством fatchord
Для предобработки данных используется два подхода. Либо получить спектрограммы из звука (с помощью преобразования Фурье), или из текста (с помощью модели синтеза). Google рекомендует второй подход.
Тренировка
Итого
Советы и выводы
Можете синтезировать свой голос онлайн с помощью colab, или посмотреть мою реализацию на github и скачать мои веса.
The Voices (Cursed)
The Voices:C’s appearance in-game
The Voices (Cursed), or The Voices:C for short, is a playable trollge character featured in the game with a legendary rarity. He has two phases and is known for being one of the rarest trollges and one of the best to use in combat.
Contents
Obtaining [ ]
Appearance: [ ]
The Voices;C in his phase 2 form
The Voices:C is depicted as a sad trollface that also has a giant ghost-like transparent entity behind him that follows wherever he goes. The entity possesses a large, bulging eye that has a cross that runs across the sclera and its pupils, it also has a giant cross that runs across his torso. The entity mirrors every action that the trollface performs, including his axe swing and walking motion. It also emits a black flame with a purplish hue.
In his phase 2, the trollface takes the entity’s face and his left hand gets a rusty texture, mixing with a purplish color. He only possesses only one property (eye) from the entity and no other.
Phases: [ ]
The Voices:C consists of 2 phases, his first phase has 1000 health, and his second phase consists of 1500 health. When The Voices:C drops to 150 health on his first phase, his second phase will initiate, playing an animation where he points forward and casts a big explosion around him that does approximately 180 damage if caught in the vicinity of it. His phase 2 has a walkspeed that is comparable to Dream.
Trollge Meme
Popular:
Trollge
About
Trollge refers to a unsmiling Trollface partially obscured with shadow. Circulated since July 2020, Trollge gained its name and popularity from to a series of creepypasta-styled countdown videos that warn the viewer about the upcoming arrival of an entity named «Trollge» and advice to seek shelter. The videos were posted in /r/196 and /r/okbuddyretard subreddits in mid-November 2020 and received further spread online through reposts.
Origin
The meme is based on an older GIF of Trollface going from a neutral expression to smiling. The GIF was created approximately in late 2012 by an unknown author (shown below).
The exact origin of the unsmiling, partially obscured Trollface referred to as «Trollge» is unknown. On July 1st, 2020, iFunny [14] user JolyneC reposted the earliest found video of the face, with the post gaining over 1,700 smiles in seven months (shown below).
In July and August 2020, the video, GIF and image of the face saw moderate circulation on iFunny. For example, on August 6th, 2020, iFunny [15] user poolnoodle posted a still image of the face captioned «something has awoken.» The post received over 2,800 smiles in seven months (shown below).
On November 17th, 2020, Redditor unfunny_man123 started posting countdown videos about the upcoming arrival of an entity named «Trollge.» The videos depict the distorted version of Trollface and contains a message warning the viewer, similar to the original Random Chimp Event posts. The first video in the series (shown below) received over 1,100 upvotes in /r/196 [1] and over 100 upvotes in /r/okbuddyretard [2] subreddit in two weeks.
Spread
Between November 17th and 20th, unfunny_man123 posted a total of five videos in which they counted down five days remaining until the arrival of «Trollge.» On November 21st, 2020, unfunny_man123 [3] posted the final video «documenting» the arrival of the entity. The post received over 2,900 upvotes in /r/196 subreddit in ten days (shown below).
In addition to the meme miniseries, on November 26th, unfunny_man123 [4] posted a Cover Yourself in Oil Trollge meme that gained over 120 upvotes in one week.
In late November 2020, the meme series received further spread online through reposts on iFunny and Instagram. For example, a November 26th, 2020, reupload of the final video by Instagram [5] user lemonrepost received over 7,100 views and 1,600 likes in one week. A November 27th repost by iFunny [6] user Sloano gained over 110 smiles in the same period.
Further Use
The unsmiling, partly obscured Trollface introduced in the videos gained further spread online separate from the original videos. On November 18th, 2020, Redditor [7] trollface_gaming posted a video «Le Cops Have Found Me» to /r/trollface subreddit which used the face, gaining over 390 upvotes.
The video was widely circulated online in the following weeks. For example, on November 18th iFunny [8] user Dozet and YouTube [9] user Biden Gaming both reuploaded the video (YouTube reupload shown below). A November 20th, 2020, reupload by Instagram [10] user honeynut.woomy received over 80,000 views and 14,600 likes in two months, while a November 23rd, 2020, repost by Redditor [11] Uchihabreed gained over 12,500 upvotes in /r/okbuddyretard in the same period.
Starting in early December 2020, Trollge gained notable popularity in Trollface-related subreddits such as /r/trollface and /r/coveryourselfinoil. On December 16th, 2020, Twitter [12] user @Slictzer posted a meme that used the Trollge as a punchline, gaining over 3,600 retweets and 30,300 likes prior to being removed (shown below, left). The tweet inspired a two-panel format, a derivative Cover Yourself in Oil meme. For example, a on December 17th, 2020, Redditor [13] LeOnYx2017 posted a meme that received over 4,800 upvotes in /r/okbuddyretard in one month (shown below, right).