A 70 milliárd paraméteres DeepSeek R1 LLM-et is lokálisan futtatná az AMD - Fototrend Hozzászólások

LOGOUT témák

PROHARDVER! témák

Mobilarena témák

IT café témák

GAMEPOD témák

Új hozzászólás Aktív témák

#65 hokuszpk nagyúr DarkByte #64

Új Válasz 2025-02-28 07:36:15 #65
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

hokuszpk

nagyúr

válasz DarkByte #64 üzenetére

"hogy mi is az az LLM"
már régóta tudjuk. Low Level Marketing.
#64 DarkByte addikt etomcat #62

Új Válasz 2025-02-27 21:29:17 #64
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

DarkByte

addikt

válasz etomcat #62 üzenetére

Javaslom megnézni Andrej Karpathy unikumnak számító 3,5 órás videóját arról hogy mi is az az LLM, hogyan tanítják be őket, milyen korlátjaik vannak. [link]
Nagyon jól felépített, többször összegez, jól követhető, igyekszik közérthető módon fogalmazni.
Kb. a legjobb összefoglalója annak hol tart most ez a történet, lehozza a földre a misztikum világából. Plusz segít elhelyezni hogy önmagában, kiegészítő eszközök nélkül egyetlen LLM sem több egy hallucináló internetes dokumentum szimulátornál, ami nyers formában kb. a statisztika és a véletlen kettőse mentén esetlegesen ad csak tényszerű kimenetet.
Viszont ha odaadod neki a kontextusába az ellenőrzött tényeket (vagy felokosítod hogy igénybe vehessen külső eszközöket, pl. web search hogy ezt maga elvégezhesse), arra marha jó hogy ennek elkészítse egy emberileg olvasmányos szöveges kimenetét, tkp. mint egy nagyon kifinomult autocomplete. (hozzáteszem itt is csak annyira jó mint amennyire a kontextusba kerülő forrás, szóval ha az alatta lévő web search egy troll Reddit posztot talál meg a kérdésre hogy minden nap meg kell enni egy kis követ, azt következetesen bemásolja)
Egy nagyon érdekes képződmény az LLM, aminek vannak meglepő tulajdonságai, de az hogy hogyan tudjuk megbízható eszközként bevetni dologokban az ugyanolyan fiatal probléma.
Szerintem csak szimplán nem kell felülni a hype vonatra, de ennek ellenére azt mondom teljesen figyelmen kívül hagyni sem jó ötlet.
#63 lezso6 HÁZIGAZDA etomcat #62

Új Válasz 2025-02-26 19:44:49 #63
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

lezso6

HÁZIGAZDA

LOGOUT blog

válasz etomcat #62 üzenetére

Az AI azért készült, hogy elterelje az emberiség figyelmét mindarról, amit itt leírtál.
#62 etomcat tag

Új Válasz 2025-02-26 19:22:01 #62
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

etomcat

tag

Ezeknek a letölthető LLM modelleknek mi értelme? Elsőre mindig azt kérdezem tőlük, ki most az USA elnöke és mind azt mondja, hogy a betanításakor, 2023. áprilisában Joe Biden. Szóval az elmúlt két évről nem tudnak semmit - kvázi Robinsonok, akik visszajöttek egy lakatlan szigetről. Mind nyomja az optimista süket dumát, mert nem tudnak semmit az azóta elközelgő világvégéről, szingularitásról vagy akármiről!
Hogy lehet értelmesen beszélgetni azzal, aki nem tudja, hogy:
- Világszerte végbement-végbemegy egy populista-fasiszta fordulat, ami elkerülhetetlenül 3. vh-hoz fog vezetni, mivel hülye vezetők csak tönkretenni tudják az országaikat és azt csak háború indításával tudják leplezni
- Trump lett az USA báb elnöke és épp eladja Ukrajnát, meg vele Európát az oroszoknak
- Elon Musk átállt a demokratáktól a republikánusokhoz, átvette az USA árnyék-elnöki posztját és rohamtempóban bontja el az országot.
- Az USA legfelsőbb bírósága már tavaly eltörölte az abortusz jogot és az LGBTQPRA... kisebbségek jogfosztása épp folyamatban van
- Ruanda újra népirtással foglalkozik és ez senkit sem zavar
- Gázát a földig lerombolták, 60 ezer halottat már eltemettek, 70 ezer még a romok alatt van, lakosságát hamarosan deportálják
- A 2024. évi párizsi olimpia megnyitóját szabadkőműves feketemisévé változtatták
- Visszafordult a zöld / elektromos átállás, minden ország újra a benzinmotoros / olajfúrótornyos témát tolja, ha megsül tőle a Föld, akkor is.
Tulajdonképpen a saját fejlődésükről sem tudnak semmit ezek a modellek - hiszen az elmúlt két évben robbanásszerű volt a változás a GenAI / LLM világban, pl. a legújabb kínai csoda hatékony modell egy hónapos sincsen. Gyakorlatilag egy neandervölgyivel beszélgethetek, aki nem tudja, hogy időközben feltalálták a kereket és tranzisztort.
#61 etomcat tag

Új Válasz 2025-02-26 11:30:53 #61
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

etomcat

tag

Bányász gépeket fogják tömegesen átképezni LLM futtatónak, ha kidurran a kripto-lufi?
#60 DigitXT félisten

Új Válasz 2025-02-10 18:14:07 #60
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

DigitXT

félisten

ChatGPT egész jókat írt egy hirtelen feltett automata szívatós kérdésre.
Mondom, akkor tudná ezt illusztrálni egy ábrával? Hát behaluzott egyet:

Persze tök vicces, hogy tud így spontán rajzolni magától, csak nem sok
köze van a valósághoz. Inkább steampunk. Tud ilyet a három testőr?
#59 Raymond titán Robitrix #56

Új Válasz 2025-02-10 13:37:08 #59
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

Raymond

titán

válasz Robitrix #56 üzenetére

Attol fuggoen mit kerdeztel ahhoz egy lokalis modell is eleg lehet boven. Az aktualisan jo Qwen2.5 32B vagy a kisebb 14B is jo, de egyszeru dolgokra a sima Llama 3.1 8B is eleg.
#58 lezso6 HÁZIGAZDA Robitrix #55

Új Válasz 2025-02-10 12:25:27 #58
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

lezso6

HÁZIGAZDA

LOGOUT blog

válasz Robitrix #55 üzenetére

Mert az online ChatGPT az egy teljes modell, ami iszonyat számítási kapacitást igényel, mert több száz vagy ezer gigabájtos. Míg én a DeepSeek legbutább disztillált változatát futtattam, amit még egy Rasberry Pi is képes használható sebességgel futtatni, mert mindösszesen kb 1.1 GB az egész.
#57 DigitXT félisten Robitrix #55

Új Válasz 2025-02-10 11:51:37 #57
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

DigitXT

félisten

válasz Robitrix #55 üzenetére

Nade ehhez a válaszhoz nem is lokálisan fut egy zanzásított modellen.
Amúgy megkérdeztem a ChatGPT-t, hogy lefordítja-e angolra a kérdésem
s utána válaszol, azt mondta, hogy nem, alapból magyarul "gondolkodik".
Persze, ha kifejezetten kérem, akkor lefordítja. Amúgy 50 nyelven "beszél".
Meglepően értelmesen, csak néha olyanokat haluzik, hogy fájdalmas...
(Nem lenne ezzel baj, ha nem biztos tudásként akarná bemondani, aztán,
amikor kijavítom, hogy ez nem egészen úgy van, akkor elnézést kér, újabb
hasra ütött infót talál ki. Egész addig, amíg a helyes infót meg nem kapja:
konkrétan megkérdeztem, hogy most csak találgat? De állítja, hogy nem.)
De amúgy ha "tudja" miről beszél, egész jól tud érvelni is pro/kontra stb.
#56 Robitrix senior tag Robitrix #55

Új Válasz 2025-02-10 11:43:44 #56
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

Robitrix

senior tag

válasz Robitrix #55 üzenetére

Amúgy programoztam a hétvégén valamit és néhány dologban megkérdeztem a ChatGPT-t olyasmiben amiben elakadtam, hogy lehet megcsinálni. és egészen hasznos megoldásokat tudott mutatni pár dologban. A ChatGPT a barátom...
#55 Robitrix senior tag lezso6 #18

Új Válasz 2025-02-10 11:39:30 #55
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

Robitrix

senior tag

válasz lezso6 #18 üzenetére

Ehhez képest a ChatGPT jóval értelmesebb választ ad az amúgy értelmetlen kérdésre.
Ime és még a magyarja is tökéletes,,,,,
Ez egy klasszikus trükkös kérdés! Ha nincs más információ, akkor nem lehet biztosan megválaszolni. Viszont ha a kérdés egy olyan rejtvényre utal, ahol valamilyen módon el van rejtve a válasz (például a kérdésben szereplő számokból kikövetkeztethető), akkor érdemes átgondolni a megfogalmazást.
Ha például azt mondják:
"Egy hajón 36 láda van, hány éves a kapitány?"
— Akkor nincs egyértelmű válasz, mert a ládák száma nem feltétlenül kapcsolódik a kapitány életkorához.
De ha a kérdés egy olyan változata hangzik el, ahol például azt mondják:
"Egy hajón 45 ember van, és a kapitány életkora megegyezik az emberek számával."
— Akkor a válasz 45 év.
Van valamilyen kontextus, ami alapján pontosabban lehet válaszolni? 😊
#54 Robitrix senior tag tlac #20

Új Válasz 2025-02-10 11:33:27 #54
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

Robitrix

senior tag

válasz tlac #20 üzenetére

Én nem csak a magyarját nem értettem hanem azt se hogy miről zagyvál.
#53 Ferkósza tag DarkByte #19

Új Válasz 2025-02-01 19:07:50 #53
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

Ferkósza

tag

válasz DarkByte #19 üzenetére

Deutsch Tamás edisön .
#52 awexco őstag

Új Válasz 2025-02-01 11:14:47 #52
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

awexco

őstag

Nvidia idén hozza a 128gb ramos 1000 tops-os
3000 dolcsis ai kütyüjét …. Az lehet jó lesz ilyenekre .
#51 Geri Bátyó addikt lezso6 #49

Új Válasz 2025-01-31 18:30:26 #51
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

Geri Bátyó

addikt

LOGOUT blog (1)

válasz lezso6 #49 üzenetére

Simán el tudom képzelni, hogy a TR platformba majd hoznak MI300A-t, de amit én várok (szeretnék), az nem az "asztali szerver", hanem egy tényleges desktop platform.
#50 Raymond titán lezso6 #47

Új Válasz 2025-01-31 18:23:28 #50
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

Raymond

titán

válasz lezso6 #47 üzenetére

Teljsen mindegy egyebkent mert nincs savszel a normalis futtatasra. Meg a 12 csatornas platformon is kinlodas a dolog.
#49 lezso6 HÁZIGAZDA Geri Bátyó #48

Új Válasz 2025-01-31 17:46:42 #49
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

lezso6

HÁZIGAZDA

LOGOUT blog

válasz Geri Bátyó #48 üzenetére

De azokban nincs IGP. Ebben újítana a Strix Halo. Eddig legfeljebb valami AMD Instinct cuccot vehettél elképzelhetetlenül horror áron, de azok is megállnak asszem 128GB-nál.
#48 Geri Bátyó addikt lezso6 #47

Új Válasz 2025-01-31 17:39:05 #48
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

Geri Bátyó

addikt

LOGOUT blog (1)

válasz lezso6 #47 üzenetére

Ahhoz már ott vannak a WS platformok.
#47 lezso6 HÁZIGAZDA Raymond #45

Új Válasz 2025-01-31 17:15:49 #47
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

lezso6

HÁZIGAZDA

LOGOUT blog

válasz Raymond #45 üzenetére

Hát, 128 GB után az 512GB RAM lenne az igazi, hogy a 300-500 GB-os modellek beleférjenek. 100-300 GB közöttit nem láttam, vagy legalábbis kevés lehet belőle.
#46 Geri Bátyó addikt lezso6 #44

Új Válasz 2025-01-31 15:33:04 #46
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

Geri Bátyó

addikt

LOGOUT blog (1)

válasz lezso6 #44 üzenetére

Bezony! Kis túlzással, a proci már meg van, csak a körítés kell hozzá!
#45 Raymond titán lezso6 #44

Új Válasz 2025-01-31 15:32:21 #45
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

Raymond

titán

válasz lezso6 #44 üzenetére

Az nem ugyanaz. Ott max 128GB lesz majd ha lesz, eddig csak a 32GB-os az Asus Flow 13 a $2200 araval ismert.
#44 lezso6 HÁZIGAZDA Geri Bátyó #43

Új Válasz 2025-01-31 15:25:46 #44
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

lezso6

HÁZIGAZDA

LOGOUT blog

válasz Geri Bátyó #43 üzenetére

Háló-háló! AMD Strix Halo!
#43 Geri Bátyó addikt lezso6 #8

Új Válasz 2025-01-31 15:15:29 #43
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

Geri Bátyó

addikt

LOGOUT blog (1)

válasz lezso6 #8 üzenetére

Viszont itt lenne a lehetőség egy tényleges HEDT platformot kihozni (A Threadripper már rég nem az), aminek nem fél alaplapnyi a foglalata. A 4 csatornás memória pont jó lenne, de mondjuk min. 6600-as DDR5 támogatással, 256 GB-ig. Mehetne bele az izmos IGP-vel 8-16 mag, IGP nélkül 8-32. A TDP meg mondjuk 120-250W.
#42 TeeBee73 veterán lezso6 #18

Új Válasz 2025-01-31 14:32:32 #42
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

TeeBee73

veterán

válasz lezso6 #18 üzenetére

Vö.:
"Ó, pirsönő morgolosta Vizelevényeid mint a többözös rejtjeméh hátán a szederjes gennyekély. Huss, fohászom száll feléd kedvelátos zümmögényem! Abroncskodón körbesarj suhogó pettyeleveddel, mert szétmarcangolom takonybibircsókjaidat pacagánycsökömmel, meglásd!"
#41 Raymond titán DigitXT #39

Új Válasz 2025-01-31 12:45:02 #41
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

Raymond

titán

válasz DigitXT #39 üzenetére

Na ja, de nem az volt tole konkretan kerdezve, csak annyit kertem hogy irjon egy tortenetet amiben ezek a szavak fel vannak hasznalva. Az hogy mit jelentenek a szavak arra ezt irja (ugyanazt a chat-et folytatva):
A "csellenyűcske" nem létező madár vagy lény a magyar folklórban. A történetben kitalált szó, hogy varázslatos és csodálatos hangulatot teremtsen.
A szó részei utalnak a jelentésére:
A "csellen" gyors, fürge mozgást sugall, mintha egy kis madár cikázna.
A "tyűcske" kicsinyítőképző, ami apró és kedves lényre utal.
Tehát a "csellenyűcske" egy apró, mozgékony teremtmény benyomását kelti, tele bájjal és misztikummal. Kitalált, hogy fantáziát ragadjon magával az olvasót.
Az "uldaba" egy fiktív hangszer a történetben. Nincs valóságalapja, hanem arra lett kitalálva, hogy misztikus és ősi hangulatot teremtsen.
A név önmagában is rejtélyesnek tűnik, talán egy régimódi, elfeledett szónak hangzik. A történetben az "uldaba" egy faragott sípként van leírva, ami generációkon keresztül öröklődött, és mágikus tulajdonságokkal rendelkezik.
A célom az volt, hogy egy olyan hangszerrel ruházam fel Anyát, amely nemcsak hangot ad ki, hanem egyfajta kapcsolatot teremt a múlt és a jelen, a valóság és a fantázia között.
#40 pepeno1 tag Raymond #37

Új Válasz 2025-01-31 11:56:29 #40
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

pepeno1

tag

válasz Raymond #37 üzenetére

Szerintem ez az írás teljesen rendben van. Legalábbis eléggé összefüggő.
#39 DigitXT félisten Raymond #37

Új Válasz 2025-01-31 02:46:58 #39
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

DigitXT

félisten

válasz Raymond #37 üzenetére

Hát nem magyarázta meg, és nem alkotta a újra a viccet, de ez talán nem is várható el.Cserébe tök jópofa írást rittyentett, szerintem. Jó, hát nem kódolás, IT, de szintepatikus... Az benne az elképesztő, hogy mindezt úgy csinálja, hogy valójában nem tudja, mit csinál.
#38 freeapro senior tag Raymond #31

Új Válasz 2025-01-30 22:01:44 #38
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

freeapro

senior tag

válasz Raymond #31 üzenetére

oh, köszi
#37 Raymond titán DigitXT #36

Új Válasz 2025-01-30 21:33:51 #37
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

Raymond

titán

válasz DigitXT #36 üzenetére

Megkerdezni meg lehet midnent aztan a valasz olyan lesz amilyen, de az ilyen "creative writing" dolgokkal nincs tapasztalatom foleg nem magyarral, en csak angolul beszelek ezekkel es es szinte csak kodolas vagy mas IT dolgok.
De kiprobalaskent itt a Gemma2 27B mit dobott ki:
System prompt:
You are an expert Hungarian novelist famous for his comedic writing. Only answer in Hungarian.
Prompt:
create a short story involving the words "uldaba" and "csellentyűcske"
Valasz:
Anya apró ujjaival szorongatta az uldabát, a faragott fa sípot, amelyet dédnagymamája hagyott rá. A házikó udvarán ült, a napfény játszott a lombok között. Anya még sosem fújt bele, félt tőle, hogy elrontja a hangját, a benne rejlő varázslatot.
Anya édesanyja mesélte, hogy az uldaba hangja elhívhatja a csellenyűcskét, egy apró, kék tollú madarat, amely szerencsét hoz. Anya mindig is szerette volna látni azt a csodálatos lényt, és ma végre bátorságot gyűjtött.
Anya ajkára szorította az uldabát, behunyta a szemét, és fújni kezdett. A hang halkan kezddtt, majd egyre erősebb lett, mint a szél susogása a lombok között. Anya várt, figyelt, de nem látott semmit.
Egy pillanatig csalódottnak érezte magát, aztán észrevette, hogy körülötte a levelek táncolni kezdenek. A napfényben csillogva egy apró kék tollacska lebegve hullott le a fűre. Anya mosolygott. Tudta, hogy a csellenyűcske ott van valahol, és örökre emlékezni fog erre a napra.
Szoval nem egy fonyeremeny.
#36 DigitXT félisten Raymond #34

Új Válasz 2025-01-30 21:10:47 #36
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

DigitXT

félisten

válasz Raymond #34 üzenetére

Linkelt lezso korábban olyan képet, kifejezetten szórakoztató volt olvasni, egész emberi, ellenberger amit itt előadott az leginkább az elektromos csellentyűcskére emlékeztet. Tényleg, azt meg lehet kérdezni tőle, hogy mi az az uldaba? Ha már csellentyűcske. Bár, arról meg az a hír járja, hogy valójában csak hoax, mármint kabaréhoz készült mű írás...
#35 arabus támogató Strezi #30

Új Válasz 2025-01-30 20:48:16 #35
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

arabus

támogató

válasz Strezi #30 üzenetére

Jó hogy 2.3 terrára bővitettem én is egy emeraldal karöltve.
#34 Raymond titán DigitXT #33

Új Válasz 2025-01-30 20:42:45 #34
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

Raymond

titán

válasz DigitXT #33 üzenetére

Az LM Studio-ban latod a reasoning reszt is amikor "magaval beszel". A chat ablakba csak a valaszt irja, de folotte ott van a lenyithato resz ahol latod hogy ert oda a valaszhoz.
#33 DigitXT félisten lezso6 #18

Új Válasz 2025-01-30 20:35:25 #33
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

DigitXT

félisten

válasz lezso6 #18 üzenetére

<think>
</think>
"Gondolkodás nincs! Enyém lesz a kincs!"
#32 hardzsi2 aktív tag lezso6 #26

Új Válasz 2025-01-30 20:26:05 #32
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

hardzsi2

aktív tag

válasz lezso6 #26 üzenetére

Már értem miért saját gépen próbálod ezt (akármilyen lassú is): DeepSeek R1 vs. Chinese Censorship
#31 Raymond titán freeapro #29

Új Válasz 2025-01-30 20:03:20 #31
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

Raymond

titán

válasz freeapro #29 üzenetére

Ott van a tobbi is, de te korulbelul csak a lila(?) kiemelteket nezed:
ird be a keresobe a komplett nevet es akkor jobban filterez, peldaul:
deepseek r1 distill qwen 14b
Ugyis az az egyetlen amit meg Q4_K_M (9GB meret) futtatni tudsz a 16GB kartyan a masik ket emlitetten kivul.
#30 Strezi őstag

Új Válasz 2025-01-30 19:07:55 #30
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

Strezi

őstag

Pont tegnap jött szembe videó erről. Dual Epyc 9005 szerver deszka, 768GB memória(ez a kritikus a 24x32GB modullal a sávszél miatt) egy pár soros parancs és már jajta is van a teljes DS AI, lokálban. 7000 Dolcsi volt talán a büdzsé.
#29 freeapro senior tag

Új Válasz 2025-01-30 19:04:28 #29
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

freeapro

senior tag

Az LM Studio modell katalógusában csak a qwen 7B és llama 8B deepseek R1 modellek látszanak. A legnagyobb modellt mivel lehet futtatni?
#28 tlac nagyúr lezso6 #24

Új Válasz 2025-01-30 18:41:24 #28
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

tlac

nagyúr

válasz lezso6 #24 üzenetére

Raymond és lezso6:
köszi, akkor ez alapján hiába pakolnám tele rammal a gépet, attól még a cucc nem igazán gyorsulna nagy modellnél
#27 Raymond titán tlac #23

Új Válasz 2025-01-30 16:36:04 #27
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

Raymond

titán

válasz tlac #23 üzenetére

Csak a layer-ek egy reszet rakja a VRAM-ba (a felvazolt esetben konkretan kb. a felet), a tobbi a RAM-ban van, gyakorlatilag az fogja limitalni a sebesseget, alig gyorsabb igy mint csak RAM-bol. Ekkora mereteknel inkabb csak kiprobalasra jo, gyakorlatilag hasznalhatatlan. A VRAM meretein belul kell maradni es akkor nincs szenvedes.
#26 lezso6 HÁZIGAZDA Cefet #25

Új Válasz 2025-01-30 15:53:52 #26
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

lezso6

HÁZIGAZDA

LOGOUT blog

válasz Cefet #25 üzenetére

Az OpenAI-t Guantanamóról kérdeztem, rendesen válaszolt is.
#25 Cefet aktív tag lezso6 #15

Új Válasz 2025-01-30 15:48:09 #25
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

Cefet

aktív tag

válasz lezso6 #15 üzenetére

Az OpenAI-t is az indiánokról, Hirosimáról, Vietnámról, vagy Afganisztánról kérdezted?
#24 lezso6 HÁZIGAZDA tlac #21

Új Válasz 2025-01-30 15:47:10 #24
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

lezso6

HÁZIGAZDA

LOGOUT blog

válasz tlac #21 üzenetére

Ha nem fér bele a VRAM-ba a modell, akkor a CPU-n futtatja, de próbál offloadolni GPU-ra. Ennek hatékonyságát nem mértem még le, de valószínűleg kb nullát ér, legalábbis a 70B modellt futtatva a GPU-t csak néha-néha terhelgetni.
Nálam van még egy RTX A2000 Ada 8 GB, ami gyakorlatilag az RTX 4060 profi változata laptopba, 35 wattból. Szóval nem valami erős. A 8B modell ennek már belefér a memóriájába, így CPU-hoz képest kb 3x gyorsabb, azaz 30-32 token/sec a sebesség.
#23 tlac nagyúr Raymond #22

Új Válasz 2025-01-30 15:46:48 #23
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

tlac

nagyúr

válasz Raymond #22 üzenetére

6900xt
de mi történik nagy modellnél?
pl. a lezso6 által említettel: 70B modellt (~43 GB)
#22 Raymond titán tlac #21

Új Válasz 2025-01-30 15:27:00 #22
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

Raymond

titán

válasz tlac #21 üzenetére

Melyik kartya pontosan? A 16GB-ba belefer a 14B-ig minden igy nem masolgat semmit miutan betoltotte.
#21 tlac nagyúr lezso6 #15

Új Válasz 2025-01-30 15:25:22 #21
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

tlac

nagyúr

válasz lezso6 #15 üzenetére

ha pl. van egy támogatott amd kártya 16gb vram-mal, meg a gépen is van pl. 32gb
ilyenkor hogyan futtatja?
másolgatja a kártyába a model egy részeit vagy egyben tudja kezelni az egészet?
#20 tlac nagyúr Raymond #13

Új Válasz 2025-01-30 15:21:41 #20
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

tlac

nagyúr

válasz Raymond #13 üzenetére

hm, az úgy túl lassú
#19 DarkByte addikt lezso6 #18

Új Válasz 2025-01-30 15:11:04 #19
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

DarkByte

addikt

válasz lezso6 #18 üzenetére

Kicsit töri még a magyart Mondjuk kész csoda egyáltalán valamennyire válaszol úgy, gyanítom nem volt prioritás az ilyen korpusz.
#18 lezso6 HÁZIGAZDA DarkByte #16

Új Válasz 2025-01-30 14:39:57 #18
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

lezso6

HÁZIGAZDA

LOGOUT blog

válasz DarkByte #16 üzenetére

Valamikor magyarul gondolja végig. Illetve a 70B-nél kisebb modellek már magyarul se igazán tudnak, sőt néha beköszön egy-egy kandzsi is. A legkisebb 1.5B pedig már amolyan Temuról rendelt ChatGPT, teljesen értelmezhetetlen a magyarja:
De legalább gyors.
#17 Hunpriest senior tag DarkByte #16

Új Válasz 2025-01-30 14:37:12 #17
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

Hunpriest

senior tag

válasz DarkByte #16 üzenetére

Nekem legutóbb amikor futattam akkor kínaiul gondolkodott és angolul válaszolt a 34B.
#16 DarkByte addikt lezso6 #15

Új Válasz 2025-01-30 14:30:05 #16
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

DarkByte

addikt

válasz lezso6 #15 üzenetére

Imádom ahogy angolul gondolkodik belül, de magyarul válaszol
Most hirtelen nem találom a cikket, de valamelyik ilyen CoT modellnél olyat is megfigyeltek már, hogy bizonyos porbléma területeket nem is angolul gondol végig. Nem tudom a Deepseek mutatott-e már ilyet. Nesze neked AI security, ezt ellenőrizd hogy nincs-e hátsó szándéka
#15 lezso6 HÁZIGAZDA tlac #12

Új Válasz 2025-01-30 14:26:01 #15
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

lezso6

HÁZIGAZDA

LOGOUT blog

válasz tlac #12 üzenetére

Futtatható CPU-n is. Nálam laptopon 7940HS (~30-40 watt TDP) 64 GB DDR5-5600 RAM-mal a DeepSeek R1 70B modellt (~43 GB) futtatva Ollama-val tud kb 1.2 token/sec sebességet. Ez elég lassú, kb 5-10 perc/prompt, de működik. Pl ez 15 perc alatt sikerült.
Amúgy itt vannak az Ollama által támogatott GPU-k. Bárki kipróbálhatja.
szerk: DeepSeek R1 8B modell (~5GB) már 10 token/sec, az már kb elmegy sebesség.
#14 b. félisten

Új Válasz 2025-01-30 14:25:48 #14
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

b.

félisten

Mondjuk engem a Deepseek lokális jelenléte a gépemen nem nyugtatna meg
#13 Raymond titán tlac #12

Új Válasz 2025-01-30 14:16:06 #13
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

Raymond

titán

válasz tlac #12 üzenetére

Az hogy CPU-n vagy GPU-n fut nem a modelltol fugg hanem az inference engine-tol, tehat megy CPU-n is. DDR5-6400 mellett a 8B Q4_K_M elmegy olyan 10 tok/s a gyakorlatban ami ha turelmes vagy akkor OK, de nem eppen kellemes sebesseg.
#12 tlac nagyúr

Új Válasz 2025-01-30 14:09:20 #12
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

tlac

nagyúr

klasszik cpu-n is futtatható sok ram mellett?
vagy mindenképpen kell hozzá egy nvidia kártya is?
#11 flexxx2 őstag DarkByte #10

Új Válasz 2025-01-30 14:01:42 #11
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

flexxx2

őstag

válasz DarkByte #10 üzenetére

épp ez az, aki LLM-et akar futtatni annak a hordozhatóság az utolsó szempont, desktop-ba kellene 2-4et egymásba rakni egy lapra, 256gb rammal, és akkor már komoly cucc lenne
#10 DarkByte addikt lezso6 #8

Új Válasz 2025-01-30 13:28:10 #10
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

DarkByte

addikt

válasz lezso6 #8 üzenetére

Talán majd ilyen Nvidia DIGITS szerű mini PC szerűség lesz belőle gondolom.
Mod: úgy tűnik ASUS-éknál kotyvasztanak is ilyesmit. [link] illetve a GMK-ék is fognak ilyet csinálni. [link]
Mindenesetre nem volna rossz ha ezekhez a unified memory rendszerekhez is létezne majd idővel cserélhető RAM modul. Bár kevés esélyét látom. Túl szorosan van integrálva a SoC-hoz.
#9 Raymond titán Z_A_P #7

Új Válasz 2025-01-30 13:27:24 #9
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

Raymond

titán

válasz Z_A_P #7 üzenetére

A Strix Halo lenyege a 256bit bus-on "ravasalt" LPDDR5X RAM, csak komplett rendszerbe kaphato majd. Egyebkent AM4-es.
#8 lezso6 HÁZIGAZDA Z_A_P #7

Új Válasz 2025-01-30 13:24:18 #8
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

lezso6

HÁZIGAZDA

LOGOUT blog

válasz Z_A_P #7 üzenetére

Nem, már csak azért sem, mert 4 csatornás memóriája van, az is LPDDR5X.
#7 Z_A_P addikt Raymond #5

Új Válasz 2025-01-30 13:17:05 #7
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

Z_A_P

addikt

válasz Raymond #5 üzenetére

Ezt a ryzen procit nem lehet megvenni siman Aqua/emag, aztan bepattintom a B450 (nyilvan ujabba), es koszi megy is? Csak elore epitve lenne kaphato?
#6 sTERNI senior tag

Új Válasz 2025-01-30 13:11:44 #6
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

sTERNI

senior tag

MInt a falat kenyér...
#5 Raymond titán

Új Válasz 2025-01-30 13:03:43 #5
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

Raymond

titán

Eloszor kellenek a Strix Halo-ra alapulo termekek, merrt egyelore az Asus Flow 13 van amibol a 32GB valtozat $2200. A HP workstation szinten nem lesz egy arbajnok merthat "workstation", itt a Beelink es tarsainak kell felmutatni valamit 64GB es vagy 128GB konfiguracioban normalis aron. A 32GB a regi es uj 128bit bus cuccokbol is 800-900eur korul vannak, de igy meg mindig van esely 64-128 valtozatokra normalisabb aron. meg tavaly mondta valamelyik handheld gyarto hogy nem konnyu mert nem eppen olcson meri ezeket az AMD es ha mar a 32GB draga akkor a tobbi is huzos lesz.
#4 copass veterán

Új Válasz 2025-01-30 12:36:55 #4
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

copass

veterán

izgalmas ez AI csata!
#3 Meteorhead aktív tag Tyrel #1

Új Válasz 2025-01-30 12:32:57 #3
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

Meteorhead

aktív tag

válasz Tyrel #1 üzenetére

Vicces volna, ha nem lenne ilyen szomorú.
#2 lezso6 HÁZIGAZDA

Új Válasz 2025-01-30 12:30:23 #2
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

lezso6

HÁZIGAZDA

LOGOUT blog

Jó lenne ha ez versenyt generálna.
#1 Tyrel őstag

Új Válasz 2025-01-30 12:18:15 #1
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

Tyrel

őstag

Ééés huss, így tűntek el a Strix Halo-k a piacról, mielőtt egyáltalán megjelenhettek volna...

Új hozzászólás Aktív témák

Témaindító hír

A 70 milliárd paraméteres DeepSeek R1 LLM-et is lokálisan futtatná az AMD

Aktív témák

Új fizetett hirdetések

Üzleti előfizetők hirdetései

Állásajánlatok

Rendszermérnök

Cég: BroadBit Hungary Kft.

Város: Budakeszi

Részletek

Ügyfélszolgálat

Cég: ATW Internet Kft.

Város: Budapest

Részletek