Új hozzászólás Aktív témák
-
Raymond
titán
válasz
MasterDeeJay
#5
üzenetére
A korlatozas a konkret TensortRT es model formatum/verzio kombinaciojabol akad, a 20-as sorozat nem tamogat minden formatumot, gondolom a bfloat16 amit hasznalnak. A 8GB kartyakon a Mistral-7b a 10GB+ kartyakon pedig a Llama-2-13b tudtommal mindketto a 4bit quantized valtozat.
Az LM Studio-ban a Llama-2-7b 5bit-es verzioja (Q5_K_M) egy sima RTX2080-al olyan 55 tok/s sebeseget ad.
Az NV demot eleg problemas letolteni, nalam csak 8-10Mbit-el jott es azert igy 35GB altart egy darabig. Hagytam menni, de olyan 11GB korul megszakadt. Az hogy mennyit hozna a TensorRT egy 4090-el nem tudom, de Stable Diffusion generalasnal a konvertalt modellek olyan 70-75% pluszt hoztak sebessegben a simahoz kepest.
Új hozzászólás Aktív témák
- Projektor topic
- Építő/felújító topik
- Brogyi: CTEK akkumulátor töltő és másolatai
- Napelem
- Samsung kuponkunyeráló
- D1Rect: Nagy "hülyétkapokazapróktól" topik
- mefistofeles: Az elhízás nem akaratgyengeség!
- Sokkal jobb ajánlat lett elődjénél az iPhone 17e
- Multimédiás / PC-s hangfalszettek (2.0, 2.1, 5.1)
- Audi, Cupra, Seat, Skoda, Volkswagen topik
- További aktív témák...
- Gamer PC-Számítógép! Csere-Beszámítás! R5 2600 / RX 5700XT 8GB / 16GB DDR4 / 256SSD + 1TB HDD!
- Apple MacBook Pro 13 (2020) M1 8GB/256GB használt, megkímélt 90% akku (399 ciklus)
- Okosóra felvásárlás!! Samsung Galaxy Watch 5 Pro, Samsung Galaxy Watch 6 Classic
- Dell Wyse 5470,14",FHD,Touch,N4100 CPU,8GB DDR4,128GB SSD,WIN11
- Tp-Link Archer C64 Dual Band Full Gigabit Wi-Fi router
Állásajánlatok
Cég: Laptopműhely Bt.
Város: Budapest
