disturbed
Well-known member
- Messages
- 826
- Reaction score
- 1,513
- Points
- 233
@jovcov da, u sustini svako ko se dohvati dublje rada sa AI/LLM shvati koliko je to jos uvjek nerazvijena i nepecena tehnologija. Zanimljiva jeste, korisna u nekim situacijama ali ni blizu koliko manipulatorski tech bros propagiraju. Plastican primjer je kompanija za koju radim koja uskoro treba da ostvari IPO. AI je must-have da bi ostvarili "rezultate" na trzistu. Nema veze sto vec imas stabilan i odrziv model poslovanja - moras nekako uglaviti AI. I sad ja dubim vec 2 godine da core ostane stabilan i da ne podlegnemo pritiscima pa ne uvaljujemo AI bas svuda vec samo gdje ima smisla.
Modeli trenutno stagniraju, razvijaju se jos uvjek alati oko njih. Kvalitetnih podataka manjka, pokrali su sto su imali, nafeedali i najbizarnije stvari i to nije ni blizu dovoljno. Velicina kontekstnog prozora je isto dosegla maksimum, dalje povecanje ne donosi nista, cak po nekim testovima sposobnosti opadaju sa vecim kontekstom. Energija koja se trosi je ogromna, kad se jos na to dodaju elektricna auta ja stvarno ne vidim ekonomsku odrzivost.
SLM su zanimljivi i korisni ali nisu flashy kao ovi geepeetee akinatori.
Jedini savjeti koji imam za sebe i druge je da koriste AI, budu uvjek kriticki nastrojeni i da im izlaz u profesionalne svrhe ne bude nesto sto ne razumiju.
Ne znam sad sta ce biti sa ovim poskupljenjima, mozda cak poguraju low-performance uredjaje na trzistu a da iznajmljujemo computing power. Cloud i streaming infra je tu, sad je vrijedi opet monetizovati. Stvari se desavaju bas naglo.
Modeli trenutno stagniraju, razvijaju se jos uvjek alati oko njih. Kvalitetnih podataka manjka, pokrali su sto su imali, nafeedali i najbizarnije stvari i to nije ni blizu dovoljno. Velicina kontekstnog prozora je isto dosegla maksimum, dalje povecanje ne donosi nista, cak po nekim testovima sposobnosti opadaju sa vecim kontekstom. Energija koja se trosi je ogromna, kad se jos na to dodaju elektricna auta ja stvarno ne vidim ekonomsku odrzivost.
SLM su zanimljivi i korisni ali nisu flashy kao ovi geepeetee akinatori.
Jedini savjeti koji imam za sebe i druge je da koriste AI, budu uvjek kriticki nastrojeni i da im izlaz u profesionalne svrhe ne bude nesto sto ne razumiju.
Ne znam sad sta ce biti sa ovim poskupljenjima, mozda cak poguraju low-performance uredjaje na trzistu a da iznajmljujemo computing power. Cloud i streaming infra je tu, sad je vrijedi opet monetizovati. Stvari se desavaju bas naglo.

U pitanju je proxmox klaster sa dvije skoro iste masine i nekim headless starijim laptopom kao quorum masinom.
. I mene zanimaju detalji. Baš sam sinoć budžio Qwen2. 5 i testirao kako se ponaša u agentic režimu korišćenja. Jbg, treba mi besniji hardver. Moj jadni RTX 3060 sa 12 GB RAM nije za bolje modele.
"