Mākslīgais intelekts spēj pamanīt modeļus, ko neapbruņota acs nepamana, atklājot signālus, kas pirmajā acu uzmetienā izskatās pēc trokšņa. Pareizi paveikts, tas pārvērš nekārtīgu uzvedību noderīgā prognozēšanā – pārdošanas apjomi nākamajā mēnesī, apmeklētāju skaits rīt, klientu aizplūšana vēlāk šajā ceturksnī. Nepareizi paveikts, tas ir pārliecināts plecu paraustījums. Šajā ceļvedī mēs aplūkosim precīzus mehānismus, kā mākslīgais intelekts prognozē tendences, no kurienes rodas uzvaras un kā neļauties apmānītām ar skaistām diagrammām. Es saglabāšu praktisku pieeju, ar dažiem īsiem sarunas brīžiem un reizēm arī uzacu pacelšanu 🙃.
Raksti, kurus jūs varētu vēlēties izlasīt pēc šī raksta:
🔗 Kā izmērīt mākslīgā intelekta veiktspēju
Galvenie rādītāji mākslīgā intelekta sistēmu precizitātes, efektivitātes un uzticamības novērtēšanai.
🔗 Kā runāt ar mākslīgo intelektu
Praktiski padomi saziņai ar mākslīgo intelektu, lai uzlabotu atbilžu kvalitāti.
🔗 Kas ir mākslīgā intelekta uzvedne
Skaidrs skaidrojums par to, kā uzvednes ietekmē mākslīgā intelekta darbību un rezultātus.
🔗 Kas ir AI datu marķēšana
Ievads datu efektīvā marķēšanā mašīnmācīšanās modeļu apmācībai.
Kas veido labu mākslīgā intelekta tendenču prognozēšanu ✅
Kad cilvēki jautā, kā mākslīgais intelekts prognozē tendences, viņi parasti domā: kā tas prognozē kaut ko nenoteiktu, bet atkārtotu. Labai tendenču prognozēšanai ir dažas garlaicīgas, bet skaistas sastāvdaļas:
-
Dati ar signālu — no akmens neizspiest apelsīnu sulu. Nepieciešamas pagātnes vērtības un konteksts.
-
Funkcijas, kas atspoguļo realitāti — sezonalitāti, svētku dienas, akcijas, makro kontekstu, pat laikapstākļus. Ne visas, tikai tās, kas ietekmē jūsu situāciju.
-
Modeļi, kas atbilst pulkstenim — laika ziņā apzinīgas metodes, kas respektē secību, nepilnības un novirzes.
-
Novērtējums, kas atspoguļo izvietošanu — atpakaļejošas pārbaudes, kas simulē, kā jūs faktiski prognozēsiet. Nav nepieciešama iepriekšēja ielūkošanās [2].
-
Izmaiņu uzraudzība — pasaule mainās; arī jūsu modelim vajadzētu mainīties [5].
Tas ir skelets. Pārējais ir muskuļi, cīpslas un nedaudz kofeīna.

Core Pipeline: kā mākslīgais intelekts paredz tendences no neapstrādātiem datiem līdz prognozēm 🧪
-
Apkopot un saskaņot datus.
Apvienot mērķa sērijas ar ārējiem signāliem. Tipiski avoti: produktu katalogi, reklāmas izdevumi, cenas, makro indeksi un notikumi. Saskaņot laika zīmogus, apstrādāt trūkstošās vērtības, standartizēt mērvienības. Tas nav glamūrīgi, bet ir svarīgi. -
Inženierijas funkcijas
Izveidojiet nobīdes, slīdošos vidējos rādītājus, kustīgos kvantiļus, nedēļas dienas karodziņus un konkrētai jomai raksturīgus rādītājus. Sezonālai izlīdzināšanai daudzi praktiķi pirms modelēšanas sadala sēriju tendences, sezonālās un atlikuma komponentēs; ASV Tautas skaitīšanas biroja X-13 programma ir kanoniska atsauce uz to, kā un kāpēc šī metode darbojas [1]. -
Izvēlieties modeļu saimi.
Jums ir trīs lielas prioritātes:
-
Klasiskā statistika : ARIMA, ETS, stāvokļa telpa/Kalmans. Interpretējama un ātra.
-
Mašīnmācīšanās : gradienta pastiprināšana, nejauši meži ar laika ziņā uztverošām funkcijām. Elastīgs daudzās sērijās.
-
Dziļā mācīšanās : LSTM, temporālie CNN, transformatori. Noderīgi, ja ir daudz datu un sarežģīta struktūra.
-
Pareiza atpakaļejošā pārbaude
Laika rindu savstarpējā validācija izmanto mainīgu izcelsmi, tāpēc pagātnes testēšanas laikā nekad netiek veikta apmācība nākotnē. Tā ir atšķirība starp godīgu precizitāti un tukšu domāšanu [2]. -
Prognozējiet, kvantificējiet nenoteiktību un nosūtiet
atgriešanas prognozes ar intervāliem, uzraugiet kļūdas un pārkvalificējieties, pasaulei mainoties. Pārvaldītie pakalpojumi bieži vien uzreiz piedāvā precizitātes rādītājus (piemēram, MAPE, WAPE, MASE) un atpakaļejošās testēšanas logus, kas atvieglo pārvaldību un informācijas paneļus [3].
Īss kara stāsts: vienas palaišanas laikā mēs pavadījām papildu dienu kalendāra funkcijām (reģionālās brīvdienas + reklāmas karodziņi) un ievērojami vairāk samazinājām agrīnās kļūdas nekā mainot modeļus. Funkciju kvalitāte pārspēja modeļu jaunumu — tēma, ko jūs redzēsiet atkal.
Salīdzināšanas tabula: rīki, kas palīdz mākslīgajam intelektam paredzēt tendences 🧰
Neperfekts ar nolūku — īsts galds ar dažām cilvēciskām īpatnībām.
| Rīks / kaudze | Labākā auditorija | Cena | Kāpēc tas darbojas… kaut kā tā | Piezīmes |
|---|---|---|---|---|
| Pravietis | Analītiķi, produktu speciālisti | Bezmaksas | Sezonalitāte + svētku dienas, ātri panākumi | Lieliski piemērots bāzes līnijām; labi ar novirzēm |
| statsmodels ARIMA | Datu zinātnieki | Bezmaksas | Stabils klasiskais mugurkauls — interpretējams | Nepieciešama aprūpe ar stacionāru stāvokli |
| Google Vertex mākslīgā intelekta prognoze | Komandas lielā mērogā | Apmaksātais līmenis | AutoML + funkciju rīki + izvietošanas āķi | Noderīgi, ja jau izmantojat GCP. Dokumentācija ir detalizēta. |
| Amazones laika prognoze | Datu/ML komandas AWS platformā | Apmaksātais līmenis | Atpakaļejošā testēšana, precizitātes rādītāji, mērogojami galapunkti | Pieejamas tādas metrikas kā MAPE, WAPE, MASE [3]. |
| GluonTS | Pētnieki, mašīnmācīšanās inženieri | Bezmaksas | Daudzas dziļas arhitektūras, paplašināmas | Vairāk koda, lielāka kontrole |
| Kats | Eksperimentētāji | Bezmaksas | Meta rīku komplekts — detektori, prognozētāji, diagnostika | Šveices armijas noskaņas, dažreiz pļāpīga |
| Orbīta | Prognožu plusi | Bezmaksas | Bajesa modeļi, ticami intervāli | Jauki, ja tev patīk Priors |
| PyTorch prognozēšana | Dziļie apguvēji | Bezmaksas | Modernas DL receptes, piemērotas vairākām sērijām | Paņemiet līdzi grafiskās kartes un uzkodas. |
Jā, formulējums ir nevienmērīgs. Tā ir īstā dzīve.
Funkciju inženierija, kas faktiski virza adatu uz priekšu 🧩
Vienkāršākā atbilde uz jautājumu, kā mākslīgais intelekts paredz tendences, ir šāda: mēs pārvēršam sēriju par uzraudzītas mācīšanās tabulu, kas atceras laiku. Daži praktiski soļi:
-
Nobīdes un logi : ietver y[t-1], y[t-7], y[t-28], kā arī ripošanas vidējos rādītājus un standartnovirzi. Tas ietver impulsu un inerci.
-
Sezonalitātes signāli : mēnesis, nedēļa, nedēļas diena, diennakts stunda. Furjē termini dod vienmērīgas sezonālās līknes.
-
Kalendārs un pasākumi : svētki, produktu laišana klajā, cenu izmaiņas, akcijas. Pravieša stila svētku efekti ir tikai funkcijas ar iepriekšējiem.
-
Sadalījums : atņemiet sezonālo komponentu un modelējiet atlikumu, kad modeļi ir spēcīgi; X-13 ir labi pārbaudīta bāzes līnija šim nolūkam [1].
-
Ārējie regresori : laikapstākļi, makro indeksi, lapu skatījumi, meklēšanas interese.
-
Mijiedarbības padomi : vienkārši krustojumi, piemēram, promo_flag × day_of_week. Tas ir saraustīti, bet bieži vien darbojas.
Ja jums ir vairākas saistītas sērijas, piemēram, tūkstošiem SKU, varat apkopot informāciju par tām, izmantojot hierarhiskus vai globālus modeļus. Praksē globāls gradienta uzlabots modelis ar laika ziņā uztverošām funkcijām bieži vien pārsniedz tā svaru.
Paraugģimeņu izvēle: draudzīga kautiņa 🤼♀️
-
ARIMA/ETS
plusi: interpretējamas, ātras, stabilas bāzes līnijas. Mīnusi: sērijas pielāgošana var kļūt sarežģīta noteiktā mērogā. Daļēja autokorelācija var palīdzēt atklāt secības, taču negaidiet brīnumus. -
Gradienta pastiprināšana.
Plusi: apstrādā tabulāras pazīmes, noturīga pret jauktiem signāliem, lieliski darbojas ar daudzām saistītām sērijām. Mīnusi: ir labi jāprojektē laika pazīmes un jāievēro cēloņsakarība. -
Dziļā mācīšanās.
Plusi: uztver nelinearitāti un starpsēriju modeļus. Mīnusi: datu pieprasījums, grūtāk atkļūdot. Ja ir bagātīgs konteksts vai gara vēsture, tas var izcelties; pretējā gadījumā tas ir sporta auto sastrēgumstundā. -
Hibrīds un ansambļi
Būsim godīgi, sezonāla bāzes toņa apvienošana ar gradienta pastiprinātāju un viegla LSTM sapludināšana ir ne nekas neparasts, vainīgs prieks. Esmu vairāk reižu atkāpies no "viena modeļa tīrības" principa, nekā atzīstu.
Cēloņsakarība pret korelāciju: rīkojieties uzmanīgi 🧭
Tas, ka divas līnijas kustas kopā, nenozīmē, ka viena virza otru. Greindžera cēloņsakarība pārbauda, vai potenciālā virzītājspēka pievienošana uzlabo mērķa prognozi, ņemot vērā tā vēsturi. Runa ir par paredzošo lietderību lineāru autoregresīvu pieņēmumu apstākļos, nevis par filozofisku cēloņsakarību — smalka, bet svarīga atšķirība [4].
Ražošanas vidē jūs joprojām pārbaudāt saprātu, izmantojot jomas zināšanas. Piemērs: darba dienu ietekme ir svarīga mazumtirdzniecībā, taču iepriekšējās nedēļas reklāmu klikšķu pievienošana varētu būt lieka, ja tēriņi jau ir modelī.
Atpakaļejošā testēšana un metrika: kur slēpjas lielākā daļa kļūdu 🔍
Lai novērtētu, cik reālistiski mākslīgais intelekts prognozē tendences, atdariniet savu prognozēšanas veidu reālos apstākļos:
-
Ritoša izcelsmes savstarpēja validācija : atkārtoti apmācīt agrākus datus un prognozēt nākamo fragmentu. Tas ievēro laika secību un novērš turpmāku noplūdi [2].
-
Kļūdu metrikas : izvēlieties to, kas atbilst jūsu lēmumiem. Procentuālās metrikas, piemēram, MAPE, ir populāras, taču svērtās metrikas (WAPE) vai mēroga ziņā brīvās metrikas (MASE) bieži vien labāk darbojas portfeļu un apkopoto rādītāju gadījumā [3].
-
Prognozēšanas intervāli : nedodiet tikai punktu. Informējiet par nenoteiktību. Vadītāji reti mīl diapazonus, bet viņiem patīk mazāk pārsteigumu.
Neliela ķibele: ja vienumi var būt nulle, procentuālās metrikas kļūst dīvainas. Dodiet priekšroku absolūtām vai mērogotām kļūdām vai pievienojiet nelielu nobīdi — vienkārši esiet konsekventi.
Notiek dreifēšana: pārmaiņu atklāšana un pielāgošanās tām 🌊
Tirgi mainās, preferences mainās, sensori noveco. Koncepcijas nobīde ir vispārējs kritērijs, kas raksturo notikumus, kad mainās saistība starp ievades datiem un mērķi. Nobīdi var uzraudzīt, izmantojot statistikas testus, slīdošā loga kļūdas vai datu izplatīšanas pārbaudes. Pēc tam izvēlieties stratēģiju: īsāki apmācības logi, periodiska pārapmācība vai adaptīvi modeļi, kas atjauninās tiešsaistē. Nozares pētījumi rāda vairākus nobīdes veidus un adaptācijas politikas; nav vienas politikas, kas derētu visiem [5].
Praktiska rokasgrāmata: iestatiet brīdinājuma sliekšņus tiešraides prognozes kļūdām, pārkvalificējieties pēc grafika un sagatavojiet rezerves bāzes līniju. Ne pārāk glaimojoši, bet ļoti efektīvi.
Izskaidrojamība: melnās kastes atvēršana, to nesalaužot 🔦
Ieinteresētās personas jautā, kāpēc prognoze pieauga. Pamatoti. Modeļa agnostiskie rīki, piemēram, SHAP, teorētiski pamatotā veidā piedēvē prognozi funkcijām, palīdzot redzēt, vai sezonalitāte, cena vai akcijas statuss ir ietekmējis skaitli. Tas nepierādīs cēloņsakarību, bet uzlabos uzticēšanos un atkļūdošanu.
Manos testos īstermiņa mazumtirdzniecības prognozēs parasti dominē iknedēļas sezonalitāte un akciju karodziņi, savukārt ilgtermiņa prognozēs dominē makro līmeņa rādītāji. Jūsu rezultāti mainīsies — patīkami.
Mākonis un MLOps: piegādes prognozes bez līmlentes 🚚
Ja dodat priekšroku pārvaldītām platformām:
-
Google Vertex AI Forecast nodrošina vadītu darbplūsmu laika rindu uzņemšanai, AutoML prognozēšanas veikšanai, atpakaļejošai testēšanai un galapunktu izvietošanai. Tas arī labi sader ar modernu datu steku.
-
Amazon Forecast koncentrējas uz liela mēroga ieviešanu, izmantojot standartizētus atpakaļejošās testēšanas un precizitātes rādītājus, ko var iegūt, izmantojot API, kas palīdz pārvaldībā un informācijas paneļos [3].
Jebkurš no variantiem samazina standarta risinājumus. Vienkārši pievērsiet uzmanību izmaksām un otram datu izcelsmes vietai. Divas acis ir ļoti sarežģītas, bet paveicamas.
Mini gadījuma apraksts: no neapstrādātiem klikšķiem līdz tendences signālam 🧭✨
Iedomāsimies, ka jūs prognozējat ikdienas reģistrāciju skaitu freemium lietotnei:
-
Dati : apkopot ikdienas reģistrācijas, reklāmas izdevumus pa kanāliem, vietnes darbības pārtraukumus un vienkāršu akciju kalendāru.
-
Īpašības : nobīdes 1, 7, 14; 7 dienu slīdošais vidējais; nedēļas dienu karodziņi; binārais reklāmas karodziņš; Furjē sezonālais loceklis; un sadalīts sezonāls atlikums, tāpēc modelis koncentrējas uz neatkārtojošos daļu. Sezonālā sadalīšana ir klasisks solis oficiālajā statistikā — garlaicīgs nosaukums, liela atdeve [1].
-
Modelis : sāciet ar gradienta pastiprinātu regresoru kā globālu modeli visās ģeogrāfiskajās vietās.
-
Atpakaļejošā pārbaude : mainīga izcelsme ar iknedēļas pārdošanas apjomiem. Optimizējiet WAPE savā galvenajā biznesa segmentā. Laiku respektējošas atpakaļejošās pārbaudes nav apspriežamas, lai iegūtu uzticamus rezultātus [2].
-
Paskaidrojums : katru nedēļu pārbaudiet funkciju atribūcijas, lai redzētu, vai reklāmas karodziņš faktiski dara kaut ko citu, izņemot to, ka izskatās lieliski slaidos.
-
Uzraudzīt : ja akcijas ietekme izzūd vai pēc produkta maiņas mainās darba dienu modeļi, aktivizējiet atkārtotu apmācību. Nobīde nav kļūda — tā ir trešdiena [5].
Rezultāts: ticama prognoze ar ticamības intervāliem, kā arī informācijas panelis, kurā parādīts, kas ietekmēja situāciju. Mazāk debašu, vairāk rīcības.
Kļūdas un mīti, no kuriem klusi apiet 🚧
-
Mīts: vairāk funkciju vienmēr ir labāk. Nē. Pārāk daudz neatbilstošu funkciju veicina pārmērīgu pielāgošanu. Paturiet to, kas palīdz atpakaļejošajai pārbaudei un atbilst domēna izpratnei.
-
Mīts: dziļi tīkli pārspēj visu. Dažreiz jā, bieži vien nē. Ja datu ir maz vai tie ir trokšņaini, klasiskās metodes uzvar stabilitātes un caurspīdīguma ziņā.
-
Kļūda: noplūde. Nejauši ieviešot rītdienas informāciju šodienas apmācībā, tiks glaimoti jūsu rādītāji un sodīts jūsu produktivitāte [2].
-
Kļūda: pēdējās decimāldaļas skaitļa dzenāšanās. Ja jūsu piegādes ķēde ir nevienmērīga, strīdēties par 7,3 un 7,4 procentu kļūdu ir teātra izrāde. Koncentrējieties uz lēmumu pieņemšanas sliekšņiem.
-
Mīts: cēloņsakarība no korelācijas. Greindžera testi pārbauda paredzēšanas lietderību, nevis filozofisko patiesumu – izmantojiet tos kā drošības barjeras, nevis evaņģēliju [4].
Ieviešanas kontrolsaraksts, ko var kopēt un ielīmēt 📋
-
Definējiet horizontus, apkopošanas līmeņus un lēmumu, kuru virzīsiet.
-
Izveidojiet tīru laika indeksu, aizpildiet vai atzīmējiet nepilnības un saskaņojiet eksogēnos datus.
-
Amatniecības laggas, mainīgā statistika, sezonālie karodziņi un dažas domēna funkcijas, kurām uzticaties.
-
Sāciet ar spēcīgu bāzes modeli un pēc tam, ja nepieciešams, pārejiet uz sarežģītāku.
-
Izmantojiet mainīgas izcelsmes atpakaļejošās pārbaudes ar metriku, kas atbilst jūsu uzņēmumam [2][3].
-
Pievienot prognozēšanas intervālus — nav obligāti.
-
Nosūtīt, uzraudzīt dreifēšanu un pārkvalificēties saskaņā ar grafiku, kā arī saņemot brīdinājumus [5].
Pārāk garš, es to neizlasīju — Noslēguma piezīmes 💬
Vienkāršā patiesība par to, kā mākslīgais intelekts paredz tendences: tas mazāk attiecas uz maģiskiem algoritmiem un vairāk uz disciplinētu, laika ziņā apzinīgu dizainu. Iegūstiet pareizos datus un funkcijas, godīgi novērtējiet, vienkārši paskaidrojiet un pielāgojiet realitātes izmaiņām. Tas ir kā radio regulēšana ar nedaudz taukainiem pogām — nedaudz niķīgi, dažreiz statiski, bet, kad stacija tiek ieslēgta, tas ir pārsteidzoši skaidrs.
Ja atņemat vienu lietu: cieniet laiku, veiciet pārbaudi kā skeptiķis un turpiniet uzraudzīt. Pārējais ir tikai rīki un gaume.
Atsauces
-
ASV Tautas skaitīšanas birojs — X-13ARIMA-SEATS sezonālās izlīdzināšanas programma . Saite
-
Hyndman & Athanasopoulos - Prognozēšana: principi un prakse (FPP3), §5.10 Laika rindu savstarpēja validācija . Saite
-
Amazon Web Services — prognozētāja precizitātes novērtēšana (Amazon Forecast) . Saite
-
Hjūstonas Universitāte — Greindžera cēloņsakarības (lekciju piezīmes) . Saite
-
Gama et al. - Aptauja par koncepcijas nobīdes adaptāciju (atvērtā versija). Saite