Vai Autotune ir mākslīgais intelekts?

Vai Autotune ir mākslīgais intelekts?

Īsā atbilde: automātiskā regulēšana (Auto-Tune) klasiskajā izpratnē parasti nav “mākslīgais intelekts”. Tā galvenokārt ir DSP: tā nosaka skaņas augstumu, sasaista to ar mērķa noti vai skalu un pēc tam attiecīgi maina audio. Mūsdienu vokālajās svītās mašīnmācīšanās var parādīties blakus esošajos posmos, piemēram, izolācijā vai trokšņu samazināšanā, tāpēc kopējā darbplūsma dažreiz tiek apzīmēta kā “mākslīgais intelekts”.

Galvenie secinājumi:

Definīcijas : “Automātiskā regulēšana” var attiekties uz Antares spraudni, skaņas augstuma korekciju kopumā vai stingrās regulēšanas efektu.

Pamatmetode : Tradicionālā toņa korekcija balstās uz toņa noteikšanu, nošu kartēšanu un toņa nobīdi — nav nepieciešami apmācības dati.

Vadība : Ātruma regulēšana un “cilvēciskās pielāgošanas” iestatījumi nosaka, vai rezultāts ir smalka pulēšana vai robotiska noķeršana.

Blakus esošais mākslīgais intelekts : mašīnmācīšanās bieži parādās balss izolācijā, adaptīvā trokšņu samazināšanā, viedajā trokšņu slāpēšanā un asistenta stila ekvalaizerā.

Nav balss klonēšana : ja domājat “dziedātāju, kurš nekad nav eksistējis”, tas ietilpst sintēzes vai klonēšanas kategorijā, nevis standarta automātiskās regulēšanas kategorijā.

Vai Autotune ir mākslīgais intelekts? Infografika

Automātiskā regulēšana (klasiskais “automātiskās regulēšanas” efekts) sākās kā matemātiska audio apstrāde — klasiska toņa noteikšana + toņa maiņas teritorija, t. i., DSP stila algoritmi, kas nav “apmācīti miljoniem balsu”. ( Digitālā audio toņa korekcija — Valters Smutss )


Pirmkārt, ko cilvēki domā ar “automātiskā regulēšana” 😅

Šeit tas sapinās.

Kad kāds saka “automātiskā skaņošana”, viņš varētu domāt:

Tātad, ja jūs ar draugu par to strīdaties, jums abiem varētu būt taisnība, jo runājat par dažādām lietām. Kura ir… cilvēka uzvedības virsotne. 🙃


Vai Autotune ir mākslīgais intelekts? ✅🤏

Vai Autotune ir mākslīgais intelekts? Parasti — ne savā klasiskajā formā.

Tradicionālā skaņas augstuma korekcija pārsvarā ir DSP (digitālā signāla apstrāde) — skaņas augstuma noteikšana un frekvences mērogošanas/skaņas augstuma maiņas algoritmu pielietošana, bez nepieciešamības pēc apmācīta mašīnmācīšanās modeļa. ( Digitālā audio skaņas augstuma korekcija — Valters Smutss ; Vokālā augstuma korekcijas pamati — iZotope )

Tas ir algoritmiski. Tā ir gudra matemātika, taču tā ne vienmēr ir “mācīšanās” no datiem, kā to dara mūsdienu mākslīgā intelekta modeļi.

Bet — un te nu nāk "bet", jo vienmēr ir "bet" — daži mūsdienīgi rīki skaņas augstuma korekcijai izmanto mašīnmācīšanos saistītiem uzdevumiem (labāka noteikšana, atdalīšana, tembra apstrāde, tīrīšana). Tāpēc apjukums atgriežas atkal un atkal kā dziesma, kuru nelūdzāt Spotify atkārtoti atskaņot… 🎧 ( Demucs (mūzikas avotu atdalīšana) ; Open-Unmix )


Kas īsti notiek zem pārsega (klasiskā skaņas korekcija) 🧰

Saglabāsim šo praktisko pieeju.

Tipiska skaņas augstuma korekcijas sistēma veic dažus lielus darbus:

1) Piķa noteikšana 🎯

Tā novērtē pamatfrekvenci (uztverto noti).
To var izdarīt ar klasiskām metodēm, kas aplūko periodiskumu, harmonikas un frekvences saturu, piemēram, nulles šķērsošanas metodes un autokorelāciju monofoniskos kontekstos. ( Digitālā audio skaņas augstuma korekcija - Valters Smutss )

2) Laukuma kartēšana 🗺️

Tas izlemj, kur jānovieto piezīme:

  • tuvākais pustonis

  • tuvākā nots skalā (C mažors, a minors utt.)

  • manuāli zīmēta korekcijas līkne (vairāk “ķirurģiska”) ( Kas ir Melodyne? )

3) Skaņas maiņa 🪄

Tas pārslēdz audio uz augšu vai uz leju, nemainot laiku.
Atkarībā no algoritma tas cenšas saglabāt:

4) Laika un pārejas uzvedība ⏱️

Šī ir daļa, ko vairums cilvēku dzird vispirms:

Nevienam no tiem nav nepieciešams modelis, kas apmācīts uz milzīgiem datu kopumiem. Tas drīzāk ir kā ļoti intensīvs kalkulators, kam patīk mūzika.

Nepilnīga metafora, bet tā nedaudz atbilst: tā ir kā termostats skaņas augstumam. Ne smadzenes, ne dziedātājs… tikai pavēloša maza podziņa, kas nepārtraukti velk noti uz iestatīto temperatūru. 🌡️🎶


Kur “AI” parādās ap vokālu 🤖✨

Lūk, kas ir pavērsiens: pat ja pati skaņas augstuma korekcija ir klasiska DSP, mūsdienu vokālā darbplūsma bieži ietver rīkus, kas patiesi ir balstīti uz mašīnmācīšanos.

Šīs ir funkcijas, kas parasti ir saistītas ar mākslīgo intelektu:

Tātad, ja kāds ierauga spraudni ar uzrakstu “AI Vocal Assistant” un tajā ir iekļauta arī skaņas augstuma korekcija, viņš varētu to visu apvienot vienā slānī un nosaukt par automātisko noregulēšanu.

Un tad vēl kāds saka: “automātiskā regulēšana nav mākslīgais intelekts”, un tagad jūs abi strīdaties apļos, kā divi kaķi, kas cīnās par vienu un to pašu saulaino vietu uz grīdas. 🐈🐈


Autotune un baiļu zonas versija 😬

Šo cilvēku domā nopietni, pat ja viņi to skaļi nepasaka.

Daudzi cilvēki nejautā par skaņas augstuma korekciju. Viņi jautā:

  • "Vai tas aizstāj dziedātāju?"

  • "Vai tas ģenerē viltotu balsi?"

  • "Vai tā ir uzstāšanās, kas nekad nav notikusi?"

Klasiskā skaņas augstuma korekcija nerada pavisam jaunu skaņu. Tā maina skaņas augstumu reālā ierakstā. Jums joprojām ir nepieciešams:

  • īsts vokāls sniegums

  • frāzēšana

  • tonis

  • emocijas

  • laiks un attieksme (lietas, kas spītīgi paliek cilvēciskas)

Bet, ja pievēršamies balss klonēšanai un pilnīgai balss sintēzei, tā ir cita kategorija. Tā nav “automātiskā regulēšana” ikdienišķā nozīmē, lai gan cilvēki dažreiz šo vārdu lieto attiecībā uz visu, kas izklausās apstrādāts.

Tātad, baisajā "šis dziedātājs nekad nav eksistējis" nozīmē, vai Autotune AI nostājas uz vispārēju nē. Ne pēc noklusējuma.


Kas padara Auto-Tune versiju (vai jebkuru citu prezentācijas rīku) labu 🎛️

Ja izvēlaties toņa korekcijas rīku, “laba” versija nav tikai par to, cik perfekti tā fiksē notis. Svarīgi ir arī tas, kā tā uzvedas, kad audio kļūst cilvēcīgs un nepaklausīgs.

Meklējiet:

Būsim atklāti — labākais prezentācijas rīks ir tas, ko vari ātri izmantot, kad esi noguris un tavas ausis tevi nemelo. Tas ir pa īstam. 😵💫


Salīdzināšanas tabula: populāras skaņas augstuma korekcijas iespējas 🎚️📊

Zemāk ir sniegts praktisks salīdzinājums. Cenas ir apzināti noteiktas brīvi, jo komplekti, izpārdošanas un izdevumi bieži mainās… un arī tāpēc, ka neviens nevēlas lasīt izklājlapu, kas izliekas, ka zina jūsu maku labāk nekā jūs pats.

Rīks Auditorija Dārgs Kāpēc tas darbojas
Antares Auto-Tune (dažādi izdevumi) ( Antares Auto-Tune ) Popa, hiphopa, dzīvās mūzikas dziedātāji $$$ Ikoniska skaņa, ātra pārskaņošanas vadība, “tas” efekts — jā, tas slavenais
Kas ir Melodyne? (Celemony Melodyne ) Redaktori, inženieri, perfekcionisti $$$ Dziļa manuāla vadība, dabiskas korekcijas, korekcijas pa notīm (nedaudz intensīvi, labā nozīmē)
Viļņu regulēšana / Viļņu regulēšana reāllaikā ( Viļņu regulēšana ; Viļņu regulēšana reāllaikā ) Budžeta studijas, dzīvās mūzikas iekārtojums $$ Stabila regulēšana, vieglāks nospiedums, paveic darbu bez liekas piepūles… lielākoties
Logic Pro Flex Pitch (iebūvēts) ( Flex Pitch (Logic Pro) ) Loģikas lietotāji komplektā Ērta, pienācīga rediģēšana, tev tā jau ir, tāpēc tu to izmantosi 😅
FL Studio Pitcher (ar iebūvētu funkciju) ( Pircēja lietošanas instrukcija ) Floridas producenti komplektā Ātra radoša regulēšana, vienkārša darbplūsma, nevis smalka, ja vien nemēģināt
Cubase VariAudio ( Steinberg VariAudio ) Cubase lietotāji komplektā Integrēta rediģēšana, praktiska kompilēšanai un kadru labošanai
iZotope Nectar (skaņas augstums + vokālā ķēde) ( Nectar 4 funkcijas ) Viss vienā vokāla veidotāji $$-$$$ Vairāk vokālās svītas noskaņa — augstums ar pulējumu, labi piemērots, ja vēlaties ātrumu
Reaper ReaTune ( ReaTune (ReaEffects rokasgrāmata) ) Metālapstrādātāji, DIY inženieri $ Funkcionāls, vienkāršs, sniedz galamērķi — saskarne rada sajūtu, ka esat dzēris melnu kafiju

Atzīšanās par formatēšanas īpatnībām: jā, “komplektā iekļautā” ir reāla kategorija mūzikas programmatūras dzīvē. 🙃


Kā ražotāji to izmanto praksē (smalki pret acīmredzami) 🎧

Smalka regulēšana (pieeja “neļauj nevienam pamanīt”) 🕵️♂️

  • lēnāks korekcijas ātrums

  • saglabāt vibrato

  • izvairieties no pāreju pārtraukšanas

  • manuāli labot tikai vissliktāko pārkāpēju (parasti dažas piezīmes)

Šis ir vokāla tips, ko izmanto daudzos gadījumos, kad cilvēki to uzskata par “dabisku”. Ne tāpēc, ka dziedātājs nevarētu dziedāt, bet gan tāpēc, ka mūsdienu miksējumi ir nežēlīgi. Katra nots tiek pārbaudīta mikroskopā.

Acīmredzamais efekts (stingri noregulēts) 🤖

Šeit mazāk tiek labotas kļūdas, bet vairāk tiek runāts par stilizētu, instrumentam līdzīgu vokālu. Tas neslēpjas, tas māj tev ar roku.

Hibrīda pieeja (mana personīgā mīļākā, laikam) 🧩

  • smalks labojums pantos

  • spēcīgāka ietekme uz āķiem

  • automatizēti iestatījumi, kas mainās katrā sadaļā

Tas ir līdzīgi kā grims — vari izvēlēties dabisku, glaunu vai arī “es krāsoju savu seju kā neona tīģeris”. Viss ir piemērots. 🐯✨


Izplatīti mīti, kas nemirs 🪦

“Autotune padara ikvienu par lielisku dziedātāju”

Nē. Tas var labot toni, nevis:

  • tonis

  • ritms

  • elpošanas kontrole

  • emocionāla piegāde

  • dikcija (ja vien jūs nepārrakstat vai nerediģējat kā maniaks)

Ja izpildījums ir nedzīvs, noregulēšana dod vienkārši perfekti noregulētu nedzīvu izpildījumu. Ak, bet taisnība.

“Ja dzirdat skaņošanu, tas ir mākslīgais intelekts”

Ne obligāti. Daudzi artefakti ir tikai klasiskas skaņas augstuma maiņas blakusparādības (fāzes vokoderam raksturīga izsmērēšanās, formanta šķībums, pārejoša izplūšana utt.). ( Digitālā audio skaņas augstuma korekcija - Valters Smutss )

  • čivināt

  • metāliskas malas

  • ļodzīgas nošu pārejas

  • vibrato tiek izlīdzināts taisnā līnijā

“Tiešraides automātiskā regulēšana ir krāpšanās”

Šis ir gaumes jautājums. Tiešraides korekcija bieži tiek izmantota tāpat kā dzīvā atbalss: instruments. Daži mākslinieki to pārspīlē, citi tik tikko pieskaras. Ja tas atbilst žanram, cilvēki to pieņem. Ja tas ir pretrunā ar gaidīto, cilvēki sadusmojas. Cilvēki ir tik konsekventi... nē. 😅


Praktiski padomi, kā padarīt skaņošanu cilvēcīgāku 🧠🎙️

Ja vēlaties skaņošanu, kas nekliedz pēc “rediģēšanas”, izmēģiniet šīs darbības:

Tāpat ieturiet pārtraukumus. Jūsu ausis pielāgojas, un tad viss izklausās “labi”, un vēlāk atskaņošanas laikā var atklāties piedziedājums, kas izklausās pēc spīdīga tirdzniecības automāta. 🥴


Tātad, vai tas ir mākslīgais intelekts vai nē - noslēguma skaidrība 🔍

Nosēdināsim lidmašīnu maigi.

Vai automātiskās tunešanas mākslīgais intelekts šaurākā nozīmē mēdz nokrist šādi:

Vai Autotune mākslīgais intelekts ir tas, kā cilvēki runā par mūsdienu vokālo producēšanu:

  • Dažreiz blakus esošie rīki izmanto mašīnmācīšanos (ML — tīrīšana, atdalīšana, viedie asistenti), un cilvēki visu ķēdi apzīmē kā “AI”. ( Demucs ; iZotope Nectar 4 funkcijas )

Vai Autotune mākslīgais intelekts ir baiļu zonā “šis vairs nav īsts dziedātājs”?

  • Ne pēc noklusējuma. Tas vairāk attiecas uz balss sintēzi un klonēšanu, kas ir pavisam cita lieta.

Ja vēlaties tīru mentālo modeli:
skaņas augstuma korekcija ir kā kameras autofokuss pilnīgi viltotas fotogrāfijas izveide . Abus var izmantot mākslinieciski, abus var ļaunprātīgi izmantot, taču tie nav viens un tas pats. 📸🎶


Noslēguma kopsavilkums 🎤✅

Auto-Tune sākotnēji bija vieda audio matemātika — toņa noteikšana un toņa maiņa. Tas pēc savas būtības nav mākslīgais intelekts. Taču mūsdienu vokālās rīku ķēdes dažreiz ietver mākslīgā intelekta darbinātas papildu funkcijas, un “AI” ir kļuvis par mārketinga uzlīmi, ko uzlīmē uz visa, sākot no trokšņu samazināšanas līdz kafijas automātiem (iespējams). ( AutoTune 2026 lietotāja rokasgrāmata ; Waves Clarity Vx Pro )

Ja vēlies, pastāsti man, pie kā strādā — dzīvais vokāls, studijas ieraksts, smalks popa piesātinājums vai pilnīgs robotisks piedziedājums —, un es ieteikšu iestatījumus, kas atbilst noskaņai, nepārvēršot tavu balsi hroma flautā. 😄🎛️

Bieži uzdotie jautājumi

Vai Autotune ir mākslīgais intelekts vai tikai efekts?

Klasiskajā formā “automātiskā regulēšana” lielākoties ir tradicionāla DSP: toņa noteikšana plus toņa maiņa, ko vada tādi noteikumi kā “tuvākā nots” vai “palikt šajā skalā”. Tā ir gudra matemātika, taču tai nav nepieciešams mašīnmācīšanās modelis, kas apmācīts uz plašām balsu bibliotēkām. Neskaidrības rodas tāpēc, ka mūsdienu vokālās ķēdes var ietvert uz mākslīgā intelekta balstītus tīrīšanas rīkus, kas atrodas tieši līdzās toņa korekcijai.

Kāpēc cilvēki automātisko noregulēšanu sauc par “mākslīgo intelektu”, ja tā galvenokārt ir digitālā signāla apstrāde (DSP)?

Jo “automātiskā regulēšana” bieži tiek lietota kā saīsinājums visam vokālajam kanālam, ne tikai skaņas augstuma korekcijai. Ja spraudņa pakotnē ir iekļautas tādas lietas kā vokālā izolācija, adaptīvā trokšņu samazināšana, viedais ekvalaizers vai “asistenta” funkcijas, cilvēki var visu apzīmēt kā mākslīgo intelektu. Mārketings nepalīdz, jo “mākslīgais intelekts” tiek lietots kā plašs apzīmējums jebkam automatizētam.

Kāda ir atšķirība starp Auto-Tune (zīmolu) un “autotune” kopumā?

Auto-Tune ir specifisks Antares produkts, savukārt sarunvalodā ar vārdu “autotune” var apzīmēt jebkuru skaņas augstuma korekcijas rīku, stingri noregulētu robotizētu skaņu vai pat pilnu vokāla apstrādes ķēdi. Divi cilvēki var diskutēt par to, vai automātiskā regulēšana ir mākslīgais intelekts, vienlaikus norādot uz pilnīgi atšķirīgiem mērķiem. Ir svarīgi precizēt, vai jūs domājat spraudni, efektu vai plašāku darbplūsmu.

Kā klasiskā skaņas augstuma korekcija patiesībā darbojas zem pārsega?

Tipiska skaņas augstuma korekcijas iestatīšana novērtē vokāla pamata augstumu, sasaista to ar mērķi (tuvāko pustoni, izvēlēto skalu vai manuālu līkni) un pēc tam nobīda audio, cenšoties saglabāt laiku un vokālo raksturu. Skaņu lielā mērā ietekmē pārejas uzvedība — cik ātri notis iekrīt savās vietās. Nekas no tā nav atkarīgs no ar datiem apmācītiem modeļiem; tā ir algoritmiska apstrāde.

Kādi iestatījumi izraisa “robotizēto” cietās regulēšanas skaņu?

Raksturīgā stingrās regulēšanas noskaņa parasti rodas no ļoti ātra pārskaņošanas ātruma un stingras skalas/taustiņu fiksācijas, kas liek notīm acumirklī pārslēgties, nevis dabiski slīdēt. Rīkiem bieži tiek pievienotas “humanizācijas” (vai līdzīgas) vadīklas, lai ilgstošas ​​notis nekļūtu saplacinātas taisnā līnijā. Ja efektu dzirdat skaļi, tā bieži vien ir apzināta stilistiska izvēle, nevis “mākslīgā intelekta pārņemšana”

Vai automātiskās regulēšanas funkcija rada viltus balsi vai aizstāj dziedātāju?

Klasiskā skaņas augstuma korekcija neģenerē jaunu balsi no nulles — tā maina skaņas augstumu reālā ierakstītā priekšnesumā. Joprojām ir nepieciešams dziedātāja laiks, frāzējums, tonis, emocijas un kopējais sniegums. Bailes zona “šis dziedātājs nekad nav eksistējis” vairāk attiecas uz balss sintēzi vai klonēšanu, kas ietilpst citā kategorijā nekā standarta automātiskās regulēšanas stila skaņas augstuma korekcija.

Kur mākslīgais intelekts faktiski parādās mūsdienu vokālās producēšanas rīkos?

Mākslīgais intelekts (MI) parasti parādās blakus esošās darbībās, piemēram, vokālā izolācija (balss atdalīšana no mūzikas), adaptīvā trokšņu samazināšana, viedā trokšņu samazināšana un “asistenta” toņa veidošana. Daži rīki var izmantot arī uzlabotākas pieejas, lai trokšņainos vai nevienmērīgos ierakstos saglabātu stabilu skaņas augstuma izsekošanu. Ja šīs mākslīgā intelekta funkcijas atrodas blakus skaņas augstuma korekcijai vienā produktā, cilvēki to visu bieži vien dēvē par “MI automātisko noregulēšanu”

Kāpēc noregulētā audio skaņa dažreiz skan nepareizi vai ir “stiklveida”?

Artefakti var rasties klasiskas skaņas augstuma maiņas dēļ: vibrācijas, metāliskas malas, neveiklas nošu pārejas vai vibrato izlīdzināšana. Svarīga ir arī formantu apstrāde — ja formanti nobīdās, balsis var kļūt multfilmiskas vai iegūt neparedzētu “hēlija” kvalitāti. Šīs īpatnības nav mākslīgā intelekta pierādījums; tās bieži vien ir tikai kompromisi, kā skaņas augstuma algoritms pārveido audio formu.

Kā es varu panākt, lai skaņas augstuma korekcija skanētu dabiskāk un mazāk rediģēta?

Sāciet ar pareizas tonalitātes un mēroga iestatīšanu, jo nepareizi mērķi ātri rada acīmredzamas kļūdas. Izmantojiet lēnākus pārskaņošanas ātrumus, izvairieties no pārmērīgas slaidu un pāreju labošanas un saglabājiet formantus, ja jūsu rīks to atbalsta. Noskaņojiet kontekstā, spēlējot visu celiņu, nevis bezgalīgi solojot. Izplatīta darbplūsma ir vispirms saspiešana, tad noskaņošana — labāku taku pulēšana, aptuvenu "labošana".

Atsauces

  1. Antares — Auto-Tune Pro — antarestech.com

  2. AntaresAutoTune 2026 lietotāja rokasgrāmatadigitaloceanspaces.com

  3. Valters Smutssdigitālā audio skaņas augstuma korekcijawaltersmuts.com

  4. iZotopeNectar 4 funkcijasizotope.com

  5. iZotopebalss augstuma korekcijas pamatiizotope.com

  6. iZotopeRX 11 Voice De-Noiseizotope.com

  7. iZotopelaiks un tonis (RX) — iZotope rādiussizotope.com

  8. iZotopePiķis (Nectar 3) — Formantsamazonaws.com

  9. AntaresAuto-Tune Artist: pamata skata vadīklasantarestech.com

  10. Facebook ResearchDemucs (mūzikas avotu atdalīšana)github.com

  11. SIGSEPAtvērtā unmiksēšanasigsep.github.io

  12. CelemonyKas ir Melodyne?celemony.com

  13. ViļņiViļņu melodijawaves.com

  14. ViļņiViļņu regulēšana reāllaikāwaves.com

  15. Apple atbalstsrediģējiet skaņas augstumu un laiku, izmantojot Flex Pitch (Logic Pro)support.apple.com

  16. Image-LineKrūzes lietošanas instrukcijaimage-line.com

  17. Steinberg - Cubase VariAudio - steinberg.help

  18. REAPERReaTune (ReaEffects ceļvedis)reaper.fm

  19. WavesClarity Vx Prowaves.com

  20. sonibleviedais:deesssonible.com

Atrodiet jaunāko mākslīgo intelektu oficiālajā mākslīgā intelekta palīgu veikalā

Par mums

Atpakaļ uz emuāru