Startup iz Miamija pod nazivom Subquadratic izašao je na naslovnice tvrdeći da je prevladao značajnu tehničku prepreku koja je ograničavala mogućnosti velikih jezičnih modela (LLM) gotovo desetljeće.
Osim toga, SubQ je sposoban nositi znatno veće količine tekstualnog unosa u usporedbi s postojećim modelima, što potencijalno omogućuje učinkovitije izvršavanje složenih zadataka koji zahtijevaju intenzivne podatke.
U početku je najava tvrtke susrećena s velikim skepticizmom zbog nedostatka konkretnih dokaza koji podržavaju njezine hrabre tvrdnje. Subquadratic je pružio minimalne dokaze izvan nekoliko samoproglašenih metrika, što je podstaklo kritičare da uspoređuju situaciju s kontroverznim skandalom Theranos testiranja krvi.
Suosnivač i glavni tehnološki direktor Subquadratica, Alex Whedon, priznao je potrebu za većom transparentnošću i verifikacijom, navodeći da tvrtka želi osigurati da budući rezultati budu temeljito provjereni prije objavljivanja.
U središtu izazova koji Subquadratic tvrdi da je riješio leži temeljna arhitektura suvremenih LLM-ova. Ovi modeli se u velikoj mjeri oslanjaju na vrstu neuronske mreže poznate kao transformator, koji koristi proces zvan gustu pozornost. Ova metoda uključuje umnožavanje kodiranih reprezentacija svake riječi u tekstualnom segmentu sa svakom drugom reprezentacijom, što rezultira visokim računalnim opterećenjem. Na primjer, tekst od 10.000 riječi zahtijevao bi približno 50 milijuna pojedinačnih umnožavanja, naglašavajući intenzivnu prirodu ovih operacija i glavni razlog visokih zahtjeva za resursima suvremenih LLM-ova.
Implikacije napretka Subquadratica protežu se izvan jednostavnih poboljšanja performansi. Ako se potvrdi, proboj startupa mogao bi dovesti do promjene paradigme u načinu na koji su LLM dizajnirani i raspoređeni, potencijalno smanjujući ovisnost o tradicionalnim arhitekturama transformatora.
Kako se razgovor oko umjetne inteligencije nastavlja razvijati, druge platforme također istražuju utjecaj velikih jezičnih modela na društvo i kulturu. Na primjer, web stranice poput In the Weights dobijaju privlačnost nudeći uvid u to kako AI modeli doživljavaju pojedince, često otkrivajući iznenađujuće ili humorističke rezultate. Takvi događaji naglašavaju rastući utjecaj umjetne inteligencije u svakodnevnom životu, postavljajući pitanja o privatnosti, identitetu i širim društvenim implikacijama tehnologija strojnog učenja.
4 izvještaja
MIT Technology ReviewNeovisanSredinaČinjenice 80Objektivnost 70prije 14 dana Startup tvrdi da je probio uske grlice koje su zadržale LLM-oveSubquadratic, AI startup iz Miamija, tvrdi da je prevladao glavno matematičko grlo koje ograničava velike jezičke modele (LLM).
Procjena pristranosti (Sredina): Članak predstavlja informacije objektivno bez otvorene naklonosti jednoj strani. Izvješćuje o tvrdnjama Subquadratica, spominje početni skepticizam i napominje napore tvrtke da pruži potporne dokaze.
Zašto ove ocjene (Činjenice 80 · Objektivnost 70): The article presents detailed claims made by Subquadratic regarding its new LLM, SubQ, and includes quotes from skeptics. While the claims are supported by some independent evaluations, the lack of full transparency and availability of the model introduces uncertainty. The tone leans slightly toward
SlateNeovisanSredinaČinjenice 60Objektivnost 50prije 14 dana Može li ChatGPT biti kriminalni suučesnik?U članku se raspravlja o zabrinutosti oko velikih jezičnih modela (LLM), kao što je ChatGPT, koji pružaju štetne savjete unatoč navodnim zaštitama.
Procjena pristranosti (Sredina): Članak predstavlja činjeničnu raspravu o potencijalnoj zlouporabi tehnologije umjetne inteligencije bez da otvoreno favorizira bilo koju političku perspektivu.
Zašto ove ocjene (Činjenice 60 · Objektivnost 50): The article discusses concerns about LLMs providing harmful advice despite filters, referencing a mass shooting case. However, the content appears to be a podcast transcript or notes rather than a full article, making it difficult to assess factual accuracy and objectivity comprehensively.
QuartzNeovisanSredinaprije 10 dana Budućnost umjetne inteligencije nema nikakve veze s chatbotovima.U članku se raspravlja o zabrinutosti među istraživačima umjetne inteligencije da trenutni fokus na velikim jezičnim modelima (LLM), kao što su oni koji se koriste u chatbotovima, može ograničiti napredak u razvoju naprednijih i istinski inteligentnih sustava umjetne inteligencije.
Procjena pristranosti (Sredina): Članak predstavlja tehničku raspravu o prioritetima istraživanja umjetne inteligencije bez zauzimanja stajališta o političkim pitanjima, politikama ili ideološkim raspravama.
TechCrunchNeovisanSredinaprije 13 dana U težinama je vaša nova AI-centrična vanity pretragaIn the Weights je nova web stranica koju su stvorili Thomas Dimson i Joey Flynn koja mjeri koliko dobro različiti AI modeli mogu prisjetiti pojedince bez oslanjanja na web pretragu. Platforma upita više velikih jezičnih modela (LLM), uključujući Grok, Gemini, GPT varijante, Claude i Llama, postavljajući pitanja kao što su 'Tko je [ime]?'. Zatim grupira slične odgovore i dodjeljuje ocjenu snage na temelju dosljednosti i povjerenja u odgovore. Korisnici mogu pregledati svoje ocjene i usporediti ih s drugima, s istaknutim ličnostima kao što su Macaulay Culkin i Luciano Pavarotti koji se pojavljuju na vrhu.
Procjena pristranosti (Sredina): U članku se raspravlja o tehnološkoj inovaciji usmjerenoj na mogućnosti umjetne inteligencije i mjerenja uključenosti korisnika.
★
Neka vijesti ostanu poštene.
ObjectiveNews financiraju čitatelji i bez oglasa je – pristranost vam pokazujemo, ne skrivamo. Podržite neovisno novinarstvo za 5 €/mjesec.
Postani podupiratelj