Vakar, 12. septembrī, OpenAI izlaida jaunākos AI modeļus – o1 sēriju. Šie modeļi, o1-preview un o1-mini, ir izstrādāti, lai tiktu galā ar sarežģītiem uzdevumiem, piemēram, matemātiku, programmēšanu un zinātnisko problēmu risināšanu – īsumā, ar lietām, kas lielākajai daļai cilvēku liek pasvīst.
Tie nav pārblīvēti ar jaunām funkcijām vai vizuāli iespaidīgi, bet piedāvā būtiskus uzlabojumus precizitātes un drošības jomā, īpaši, kad runa ir par grūtiem uzdevumiem. Ja tev ir nepieciešams AI, kas var risināt sarežģītas problēmas ar lielāku precizitāti, o1 sērija varētu būt tas, kas nepieciešams. Bet vai tas ir labākais risinājums visiem? Tas atkarīgs no tā, ko tieši tu plāno ar to darīt.
“OpenAI o1”
OpenAI “o1” sērija esot labāka par GPT-4o rezultātiem. Starptautiskās Matemātikas olimpiādes testā o1 sasniedza 83%, kas liktu to ievērot pat dažiem pieredzējušākiem matemātiķiem. Salīdzinājumam, iepriekšējais GPT-4o modelis ieguva tikai 13% tajā pašā testā. Atšķirība ir kā starp velosipēdu un raķeti – abi ir transportlīdzekļi, bet viens tevi aizvedīs daudz tālāk, daudz ātrāk.
Programmēšanas sacensībās o1 modeļi pierāda savu asumu. Codeforces platformā o1 ieguva 89. procentili, ievērojami pārspējot savu priekšgājēju. Ja esi kādreiz iestrēdzis programmējot plkst. 3 no rīta… vai vēl vēlāk, o1 varētu kļūt par tavu jauno labāko draugu, ja nav citu AI rīku. Vismaz tā internetā un OpenAI apgalvo. Šis apgalvojums būs vēl jāpārbauda kādu dienu, ja/kad sākšu izmantot programmēšanas asistēntu tiešākā veidā.
OpenAI o1 drošība
AI drošība varētu neizklausīties tik aizraujoši kā drošības jostas demonstrācija lidmašīnā, bet tā patiesībā ir svarīga – īpaši, ja strādā ar programmām, kas pārspēj lielāko daļu cilvēku prāta spēju. OpenAI ir nopietni pievērsusies šo modeļu drošības uzlabojumiem, padarot tos par 59% izturīgākus pret uzlaušanu un bīstamiem pieprasījumiem, salīdzinot ar GPT-4o cai Claude 3.5 Sonnet. Būtībā kļūst grūtāk kādam pievilt šos AI, lai tie pateiktu vai izdarītu kaut ko nevajadzīgu.
Kad runa ir par sensitīvām tēmām, piemēram, vardarbību, nelegālām aktivitātēm vai uzmākšanos, o1 biežāk sniedz drošas un piemērotas atbildes. Tas ir kā starpība starp labi audzinātu draugu un to vienu čomu, kurš vienmēr pasaka kaut ko stulbu un apkaunojošu visnepiemērotakajā brīdī.
Cenas: vai ir tā vērts?
Tagad daļa, kurā visi sāk rēķināt. Ja ne visi, tad vismaz es. “o1-preview” nav lēts. Tas maksā $15 par 1 miljonu ievades tokenu un $60 par 1 miljonu izvades tokenu, kas ir dārgāk nekā GPT-4o, kurš maksā attiecīgi $2.5 un $10. Bet, ja tu meklē precizitāti tādās jomās kā matemātika un programmēšana, šī cena varētu būt pamatota.
Ja meklē kaut ko makam draudzīgāku, ir arī o1-mini, kas maksā $3 par 1 miljonu ievades tokenu un $12 par 1 miljonu izvades tokenu – par 80% lētāks nekā o1-preview, bet joprojām saglabā savu sniegumu programmēšanas uzdevumos. Tā vismaz runā. Vēl pārbaudīšu, kā jau teicu.
Trūkumi: bez interneta, bez failiem un lēna reakcija
Lai arī o1 ir spēcīgs rīks tādās jomās kā matemātika un programmēšana, tam ir daži trūkumi. Pirmkārt, tas ir lēnāks – aptuveni 30 reizes lēnāks nekā GPT-4o. Ja tev nepieciešamas ātras, reāllaika atbildes, iespējams, joprojām būs labāk turēties pie GPT-4o. Turklāt, atšķirībā no tā priekšgājēja, o1 pagaidām nevar pārlūkot internetu vai apstrādāt failus. Tāpēc, ja tavi uzdevumi prasa plašākas zināšanas ārpus STEM jomas, tev joprojām varētu būt nepieciešams GPT-4o.
Kas tālāk?
Atkal jau šis jautājums, bet… tas ir jājautā. OpenAI vēl nav pabeiguši darbu. Viņi ir devuši mājienus par papildu atjauninājumiem o1 sērijai, ieskaitot iterneta pārlūkošanas iespējas un failu augšupielādes. Tā kā pašreizējā o1 versija ir lieliska specializētiem uzdevumiem, nākotnes atjauninājumi varētu padarīt to par universālāku rīku, kas piemērots plašākai lietošanai.
Īstais jautājums ir par to, kā šie modeļi attīstīsies nākotnē. Būs interesanti redzēt, kā tehnoloģiju entuziasti, izstrādātāji un pētnieki pielāgosies šo rīku ikdienas izmantošanai savos risinājumos.
Kā tu domā? Vai precizitāte ir lēnāka ātruma vērta, vai tomēr labāk pieturēties pie plašāku funkciju modeļiem?
Publicēts arī: https://toot.lv/users/rolandinsh/statuses/113131647624034787
2024-09-13T18:25:47.389Z via rolandinsh blogi