Notice: Undefined variable: post_id in /data/wordpress/htdocs/wp-content/plugins/pressapps-knowledge-base/public/partials/page/page-single.php on line 41
Tekoäly (AI)
Sisältö
Käsitteet
Tekoäly (AI) on wikipedian määritelmän mukaan on tietokone tai tietokoneohjelma, joka kykenee tekemään älykkäinä pidettäviä toimintoja. Tekoälyn tarkempi määrittely on avoin, koska älykkyyttä itsessään on vaikea määritellä.
Kapea tekoäly (ANI) on tekoälyn tyyppi, joka on suunniteltu suorittamaan tietyn tehtävän tai tehtäväjoukon. Se tunnetaan myös nimellä heikko tekoäly tai soveltuva tekoäly. Kaikki nykyisin käytössä olevat tekoälyjärjestelmät, kuten ääniassistentit Alexa ja Siri, Teslan ajoavustin tai ChatGPT, ovat niin sanottuja kapeita tekoälysovelluksia.
Yleistekoäly (AGI) on tekoälyn tyyppi, joka pystyy oppimaan minkä tahansa henkilön suorittaman älyllisen tehtävän. Se on hypoteettinen käsite, jota ei ole vielä saavutettu käytännössä, mutta sitä käytetään usein vertailukohtana nykyisten tekoälyjärjestelmien kykyjä arvioitaessa. Oppii ajamaan autoa, kokkaamaan, analysoimaan suuren määrän dataa, minkä tahansa työtehtävän. Ja tämä on kaiken kehityksen tavoitteena.
Tekoäly = Tukiäly
Tekoälystä pitäisi ennemmin puhua tukiälynä. Se toimii loistavasti apulaisena, ideoijana, sparraajana, mentorina, tehostajana yms. Se ei kuitenkaan poista aiheen substanssiosaamista käyttäjältä vaan päinvastoin vaatii sitä, jotta voimme tarkistaa tekoälyn tuottaman tiedon oikeellisuuden. Se tukee myös siis itsenäistä ajattelua.
Kielimallit
Kielimallit (LLM) ovat tekoälytyökaluja, jotka voivat lukea, tiivistää ja kääntää tekstejä. Ne ennustavat tulevia sanoja sanasarjassa koneoppimisen avulla muodostettujen todennäköisyyksien mukaan, jolloin ne voivat luoda samanlaisia lauseita kuin ihmiset puhuvat ja kirjoittavat. Kielimallin tehtävä on siis generoida ihmismäistä sujuvaa tekstiä sille annetun syötteen (prompt) perusteella. Yleisin syötteen antotapa tekoälysovellukselle on tekstikenttään kirjoitettu teksti.
Kieliopillisesti oikea ja järkevän kuuloinen teksti luo harhakuvan vastauksen oikeellisuudesta vaikka voi olla täysin vääristynyt. Joten aiheen substanssiosaamista tarvitaan edelleen. Usein tekoälyn kirjoittaman tekstin paikkansa pitävyyden tarkistaminen ja lähteiden merkitseminen on työläämpää kuin itse tuottaa tuottaa tekstiä lähteiden perusteella.
Kielimalli ei ole älykäs
Kielimalli on vain ohjelma, joka osaa muodostaa lähdemateriaaliin perustuvien todennäköisyyksien perusteella tekstiä vastauksena syötteeseen, joka sille on annettu. Sillä ei ole mitään osaamista tai ymmärrystä sisällöstä vaikka sujuva ja kieliopillisesti oikea vastaus saattaa antaa hämäävän kuvan. Vastuu kirjoituksen tietojen oikeellisuudesta on tekoälyn käyttäjällä.
Kielimallit pystyvät käsittelemään syötteen sisällön yleensä kymmenillä kielillä, mukaan lukien myös ohjelmointikieliä, mutta tämä vaihtelee sovelluksittain.
Kielimallit toimivat pohjana generatiivisille tekoälysovelluksille. Eli ne pystyvät luomaan vastauksia toiveiden mukaan, jotka on annettu syötteillä. Esimerkiksi ChatGPT pystyy tuottamaan tekstiä, jota ei parhaimmillaan voi erottaa ihmisen kirjoittamasta tekstistä. Lisäksi kuvageneraattorit, kuten DALL-E 2, pystyvät luomaan ja muokkaamaan kuvia niille annettujen tekstisyötteiden perusteella. Kukin sovellus voidaan opettaa omaan erityiseen tehtäväänsä koneoppimisen avulla. Koneoppiminen on tekoälyn osa-alue, jonka tarkoituksena on saada sovellus toimimaan entistä paremmin pohjatiedon ja mahdollisen käyttäjän toiminnan perusteella.
Generatiivisen tekoälyn rajoitukset
Tekoäly heijastelee sille syötettyä lähdemateriaalia. Rajoitteena käytölle pitää muistaa mahdollinen tiedon paikkansa pitämättömyys eli hallusinointi vastauksessa. Lisäksi se saattaa tarjota puolueellista tai vahingoittavaa tietoa, joka johtuu kielimallin opetuksessa käytössä olleesta lähdemateriaalista. Tämä johtuu, että valtaosa kielimallin opettamiseen käytetystä lähdemateriaalista tulee länsimaista. Se, että lähdemateriaalina ei ole käytetty esimerkiksi Kiinasta tai Afrikasta materiaaleja, heikentää sovelluksen laatua ja kykyä tuottaa puolueetonta tietoa eri kulttuurit huomioon ottaen. Vastuu kirjoitetun tiedon oikeellisuudesta on tekoälyn käyttäjällä. Tekoäly itsessään ei välitä siitä, onko jokin asia totta, minkä se generoi käyttäjälle.
GPT-3
GPT-3 (Generative Pre-training Transformer 3) on kolmas OpenAI:n kehittämän kielimallin versio, joka on julkaistu keväällä 2020. Se on koulutettu suurella tekstimäärällä ennustamaan seuraava sana sanasarjassa sen perusteella, mitä sanoja on ennen sitä (”jos-niin”-sääntöparametreja) . Esimerkiksi, jos mallille annetaan sanat “Kissa istui maton”, se ennustaa seuraavan sanan olevan “päällä”. Näitä parametreja on tässä kielimallissa 175 miljardia. Oppimisprosessi on periaatteessa samanlainen kuin pululla.
Rajoitteena on tiedon paikkansa pitämättömyys eli hallusinointi. Lisäksi saattaa tarjota puolueellista tai vahingoittavaa tietoa, joka johtuu kielimallin opetuksessa käytössä olleesta lähdemateriaalista. Lisäksi datasetin tietoja ei ole päivitetty joulukuun 2021 jälkeen.
Tämän kielimallin versio 3.5 oli sovelluksen ChatGPT:n moottorina, joka julkaistiin marraskuu 2022 lopulla.
GPT-4 (katso video, YouTube)
Tämä uusin versio kielimallista julkaistiin 14.3.2023. Kielimallin käyttämien parametrien määrää tai tietomallin kokoa ei ole kerrottu, mutta sen sanotaan olevan luovempi, ymmärtävän entistä monimutkaisempia ohjeita ja pystyvän ratkaisemaan entistä monimutkaisempia ongelmia, kuin aikaisemmat kielimallit. Lähdemateriaalina on kielimallin koulutukseen on käytetty julkista dataa (internet) sekä lisensoituja kolmannen osapuolen kirjastoja.
Sen arvellaan hallitsevan ja voivan auttaa entistä vaativimmissa ja monimutkaisemmissa luovuutta vaativissa ja teknisissä kirjoitustehtävissä, kuten kappaleiden säveltämisessä, käsikirjoitusten kirjoittamisessa tai käyttäjän kirjoitustyylin oppimisessa. Lisäksi GPT-4 hyväksyy kuvia syötteinä ja voi luoda kuvaus tekstejä kuvien sisällöstä, luokituksia ja analyyseja. Myös kyky käsitellä suurempia määriä tekstiä syötteenä on parantunut. GPT-4 pystyy käsittelemään yli 25 000 sanaa tekstiä, mikä mahdollistaa käyttötapaukset, kuten pitkän muodon sisällön luomisen, laajennetut keskustelut sekä asiakirjahaun ja -analyysin.
Tehokkuuden lisäksi GPT-4 on tarkempi tiedon paikkansa pitävyyden suhteen. Tarkkuus on saatu nostettua aiheesta riippuen 70-80% tasolle. GPT-3.5 sai keskimäärin faktoista oikein 50-60%. Mutta voi edelleen tarjota väärää tai puolueellista tietoa, kuten edeltäjänsä. Sen datasetti kattaa joulukuuhun 2022 asti.
Tämä uusi kielimalli on tällä hetkellä käytössä ChatGPT:n maksullisessa versiossa, ChatGPT Plussassa. katso video (youtube).
Linkkejä
Notice: Undefined variable: output in /data/wordpress/htdocs/wp-content/plugins/pressapps-knowledge-base/public/partials/page/page-single.php on line 83