-
Fototrend
A legtöbb kérdésre (igen, talán arra is amit éppen feltenni készülsz) már jó eséllyel megtalálható a válasz valahol a topikban. Mielőtt írnál, lapozz vagy tekerj kicsit visszább, és/vagy használd bátran a keresőt a kérdésed kulcsszavaival!
Új hozzászólás Aktív témák
-
lenox
veterán
válasz Raymond #43571 üzenetére
Ez meg a gv100:
Total VRAM 32767 MB, total RAM 32723 MB
Set vram state to: NORMAL_VRAM
Always offload VRAM
Device: cuda:0 Quadro GV100 : native
VAE dtype: torch.float32[Fooocus] Encoding positive #1 ...
[Fooocus Model Management] Moving model(s) has taken 0.17 seconds
[Fooocus] Encoding positive #2 ...
[Fooocus] Encoding negative #1 ...
[Fooocus] Encoding negative #2 ...
[Parameters] Denoising Strength = 1.0
[Parameters] Initial Latent shape: Image Space (1024, 1024)
Preparation time: 2.79 seconds
[Sampler] refiner_swap_method = joint
[Sampler] sigma_min = 0.0291671771556139, sigma_max = 14.614643096923828
Requested to load SDXL
Loading 1 new model
[Fooocus Model Management] Moving model(s) has taken 2.69 seconds
100%|██████████████████████████████████████████████████████████████████████████████████| 30/30 [00:10<00:00, 2.78it/s]
Requested to load AutoencoderKL
Loading 1 new model
[Fooocus Model Management] Moving model(s) has taken 0.25 seconds
Image generated with private log at: C:\Fooocus\Fooocus\outputs\2024-03-29\log.html
Generating and saving time: 15.11 seconds
[Sampler] refiner_swap_method = joint
[Sampler] sigma_min = 0.0291671771556139, sigma_max = 14.614643096923828
Requested to load SDXL
Loading 1 new model
[Fooocus Model Management] Moving model(s) has taken 1.74 seconds
100%|██████████████████████████████████████████████████████████████████████████████████| 30/30 [00:11<00:00, 2.68it/s]
Requested to load AutoencoderKL
Loading 1 new model
[Fooocus Model Management] Moving model(s) has taken 0.25 seconds
Image generated with private log at: C:\Fooocus\Fooocus\outputs\2024-03-29\log.html
Generating and saving time: 14.62 seconds
Requested to load SDXLClipModel
Requested to load GPT2LMHeadModel
Loading 2 new models
Total time: 32.58 seconds
[Fooocus Model Management] Moving model(s) has taken 0.77 seconds -
válasz Raymond #43573 üzenetére
Az biztos hogy végigpróbálom más biosokkal. Nvsmi-vel lehet húzni korlátozottan de a hbm is csak 810mhz max. Boostot 1380-ra fel tudtam rakni de nem boostol. Tdp limit is 100%hogy van szóval a legjobb v100-as biossa kezdem majd. Meg ugye a pcie 1x bár az nekem nem nagy gond.
Quadro gv100 biosa lenne logikus hátha van rajta venti vezérlés is már ha az áramkör rajta van. (Most kézzel tekergetem egy régi titan szabályzóval)[ Szerkesztve ]
-
válasz Raymond #43561 üzenetére
SD-re felraktam a tensorRT kieget bekapcsolva 8 kikapcsolva 3
Nem tudom hogyan lehetne tesztelni rendesen.
Loading TensorRT engine: T:\AI\stable-diffusion-webui\models\Unet-trt\v1-5-pruned-emaonly_d7049739_cc70_sample=2x4x64x64-timesteps=2-encoder_hidden_states=2x77x768.trt
Loaded Profile: 0
sample = [(2, 4, 64, 64), (2, 4, 64, 64), (2, 4, 64, 64)]
timesteps = [(2,), (2,), (2,)]
encoder_hidden_states = [(2, 77, 768), (2, 77, 768), (2, 77, 768)]
latent = [(2, 4, 64, 64), (2, 4, 64, 64), (2, 4, 64, 64)]
100%|██████████████████████████████████████████████████████████████████████████████████| 20/20 [00:02<00:00, 7.84it/s]
Total progress: 30it [07:30, 15.00s/it]
100%|██████████████████████████████████████████████████████████████████████████████████| 20/20 [00:02<00:00, 7.71it/s]
Total progress: 100%|██████████████████████████████████████████████████████████████████| 20/20 [00:02<00:00, 6.71it/s]
100%|██████████████████████████████████████████████████████████████████████████████████| 20/20 [00:02<00:00, 7.30it/s]
Total progress: 100%|██████████████████████████████████████████████████████████████████| 20/20 [00:02<00:00, 6.88it/s]
Dectivating unet: [TRT] v1-5-pruned-emaonly████████████████████████████████████████████| 20/20 [00:02<00:00, 8.02it/s]
100%|██████████████████████████████████████████████████████████████████████████████████| 20/20 [00:06<00:00, 2.93it/s]
Total progress: 100%|██████████████████████████████████████████████████████████████████| 20/20 [00:06<00:00, 2.94it/s]
Activating unet: [TRT] v1-5-pruned-emaonly█████████████████████████████████████████████| 20/20 [00:06<00:00, 3.01it/s]
Loading TensorRT engine: T:\AI\stable-diffusion-webui\models\Unet-trt\v1-5-pruned-emaonly_d7049739_cc70_sample=2x4x64x64-timesteps=2-encoder_hidden_states=2x77x768.trt
Loaded Profile: 0
sample = [(2, 4, 64, 64), (2, 4, 64, 64), (2, 4, 64, 64)]
timesteps = [(2,), (2,), (2,)]
encoder_hidden_states = [(2, 77, 768), (2, 77, 768), (2, 77, 768)]
latent = [(2, 4, 64, 64), (2, 4, 64, 64), (2, 4, 64, 64)]
100%|██████████████████████████████████████████████████████████████████████████████████| 20/20 [00:02<00:00, 7.88it/s]
Total progress: 100%|██████████████████████████████████████████████████████████████████| 20/20 [00:02<00:00, 6.85it/s]
Total progress: 100%|██████████████████████████████████████████████████████████████████| 20/20 [00:02<00:00, 8.00it/s]
[ Szerkesztve ]
-
válasz Raymond #43578 üzenetére
Abból gondolom én is hogy működik mert ki be kapcsolva más az eredmény. Illetve 200w fölé megy a fogyasztás.
CUDA-Z benchmark:GPU Core Performance
Single-precision Float: 13.4887 Tflop/s
Double-precision Float: 441.227 Gflop/s
64-bit Integer: 3298.58 Giop/s
32-bit Integer: 13.5213 Tiop/s
24-bit Integer: 13.3683 Tiop/sFloat32 az hozza a 14Tflopsot (~2080Ti), a Float64 az nem bár az nem is lényeg.
Fooocus használja a Float16-ot a logokból látszik.
Az órajelek még mindíg alacsonyabbak mint kellene, de majd javítok rajta. A pcie sávszél is megoldódik, két-két SMD hiányával tiltották le
[ Szerkesztve ]
-
-
válasz Raymond #43578 üzenetére
MSI afterburner OC scan után.
Az várható volt hogy a HBM2 az 1Ghz-es rajta nem 810.
GPU 1582@0.794v CUDA-Z és Aida tesztek alatt.
Stable diffussion alatt ugyan ennyi, GPU power 210w, board power 262W
Viszont így már 68 fokig felmegy, majd a rendes hűtővel ki fogom tolni a tdp limitet nagyobbra mert tartalék van benne még.Elléggé furcsa íve lett, nem is értem miért ilyen:
[ Szerkesztve ]
-
-
-
válasz Raymond #43590 üzenetére
Nem kapok sajnos. töredéke sincs.
V100 GPU fizikailag ugyan azon számokkal mint a Tesla V100-ason. GV100-893-A1
Szerintem szoftveres a limit. Volt 2 éve egy nagy nvidia driver leak 80Gb forráskóddal, a legtöbb modder azzal dolgozik. Nekem nincs rá tudásom hogy értelmezzem és megírjam hiába tudok alap szinten programozni.Single az okés hozza amit kell. De double 462
Ennek kellene lennie
FP32 (float)14.13 TFLOPS
FP64 (double)7.066 TFLOPS (1:2)[ Szerkesztve ]
-
-
-
S_x96x_S
addikt
válasz Raymond #43859 üzenetére
> Mindegy egyese eladott 8x H100 dobozban ott a Mellanox cuccok is.
Még az új Azure AMD MI300X VM -eket is nVidiás kártyával kötik össze.
"Introducing the new Azure AI infrastructure VM series ND MI300X v5"
"ND MI300X v5 VMs feature high-throughput, low latency InfiniBand communication between different VMs. Each GPU has its own dedicated 400 Gb/s NVIDIA Quantum-2 CX7 InfiniBand link to give 3.2 Tb/s of bandwidth per VM. InfiniBand is the standard for AI workloads needing to scale out to large numbers of VMs/GPUs."Mottó: "A verseny jó!"
-
PuMbA
titán
válasz Raymond #44214 üzenetére
A 8 GB-os kontra 16GB-os 4060 Ti kártyák képeire gondoltam, ami kiveri a szemünket a hozzászólásban Jól látszik, hogy hiába használ csak 7GB VRAM-ot a 8GB-os kártyán a Forbidden West, a 16GB-os kártyán majdnem kétszer több az fps és ott már 9,5GB-ot használ.
Ratchet & Clank esetén ugyanez játszódik le. A 12GB-os 4070-et 60%-kal veri a 16GB-os 7900GRE csak a VRAM miatt 1440p maximum grafikán, hiszen más játékokban a két kártya között csak 10% sebesség különbség van.
[ Szerkesztve ]
-
S_x96x_S
addikt
válasz Raymond #44282 üzenetére
> A FG ( Frame Gen ) az amit a 40-es sorozatra limitaltak.
Akkor ha jól értelek szerinted se igaz,
hogy az RTX2000-res szérián is tökéletesen megy a DLSS 3.7.
Feltéve ha a "tökéletes" alatt az nVidia "Tökéletest" értjük.Amúgy az nVidia (marketing táblázat ) a DLSS verziókra :
https://www.nvidia.com/en-us/geforce/technologies/dlss/Mottó: "A verseny jó!"
-
S_x96x_S
addikt
válasz Raymond #44286 üzenetére
> Direkt ugy irtam hogy ne zavarjon meg a szamozas
> (fuggetlenul attol hogy azt tenyleg nem erted vagy csak megjatszod).másoknak irtam.
> A FG az amit a 40-es sorozatra limitaltak.
lefordítva:
a DLSS 3.7 -része az FG ; és ez a rész NEM megy az RTX 20 -on.
Ami megfelel a hivatalos nVidia kommunikációnak is.Mottó: "A verseny jó!"
-
S_x96x_S
addikt
válasz Raymond #44436 üzenetére
> Mivel a CoWoS-L a problema amit a kozumer kartyaknal
> nem ahsznalnak a hir ezeket nem erinti.Szerintem a CoWoS-S kapacitás kisebb lett a CoWoS-L -re történt konverzió miatt.
Vagyis a gyártási/packaging nehézségek és a CoWoS-L technológia késedelmei - áttételesen - befolyásolják a teljes gyártási ütemtervet és kapacitás/erőforrás kihasználást.
Például a TSMC a CoWoS-S kapacitás egy részét már átállította CoWoS-L -re,
de a CoWoS-L -en nincs még érdemi termelés a tervezési hiba miatt. ( 3 hónap kiesett )
Emiatt az - átállás miatt kisebb - a CoWoS-S kapacitás
és ennek elosztását újra kell tervezni és nem biztos, hogy az RTX50-nek jut."There has also been the issue of TSMC not having enough CoWoS-L capacity in aggregate. TSMC built up a lot of CoWoS-S capacity over the last couple years with Nvidia taking the lion’s share. Now with Nvidia quickly moving their demand to CoWoS-L, TSMC is both building a new fab, AP6, for CoWoS-L and converting existing CoWoS-S capacity at AP3. TSMC needs to convert the old CoWoS-S capacity as otherwise it would be underutilized and the ramp of CoWoS-L would be even slower. This conversion process makes the ramp very lumpy in nature."
( via )Az AI/DataCenter a fő prioritás
ÉS az ezzel kapcsolatos problémák és változások minden mást tervet IS módosíthatnak, és így az RTX 50 széria eredeti terveit is.NEM független egymástól a két termékvonal !
[ Szerkesztve ]
Mottó: "A verseny jó!"
-
S_x96x_S
addikt
válasz Raymond #44440 üzenetére
> Nulla kihatasa van a CoWoS-nak az RTX sorozatra mivel ott nincs hasznalva.
Igaz. Az RTX5090 még nem MCM-es.
De a folyamatban lévő
TSMC N4 -> N4P gyártósor átállás is bekavarhat,
és az biztos érinti az RTX50-t.A TSMC-nek és a többi beszállítónak alkalmazkodni kell az új módosított tervhez
( késéshez)
és ez okozhat nem várt problémákat sok más területen is.
( Second-order effects ... )Mottó: "A verseny jó!"
-
S_x96x_S
addikt
válasz Raymond #44442 üzenetére
A Blackwell(RTX50, B200) már N4P és nem N4
és a gyártósorokat ehhez át kell állítani.És ennek az átállásnak
az eddigi ütemtervét módosítani kell
a mostani változásokhoz.Másképpen az nVidiának a teljes termelési kapacitást újra kell optimalizálnia a meglévő prioritások szerint ( profit maximalizálás $$$+++ )
És a Gaming a profitabilitási lista végén van.Mottó: "A verseny jó!"
-
S_x96x_S
addikt
válasz Raymond #44444 üzenetére
amit mondani szerettem volna,
hogy az NVidia terveinek módosulása egy Operációkutatási(OR) probléma
és ennek az optimális megoldása kihathat a gaming blackwell-re is,
mivel az nem a régi (N4) gyártósorokon készülne,
hanem az új N4P-n.vagyis a gaming blackwell és a DC blackwell osztozik jó pár erőforráson
és emiatt az egyikben történő változás kihat(hat) a másikra is.[ Szerkesztve ]
Mottó: "A verseny jó!"
-
válasz Raymond #44533 üzenetére
Ránézek. Olyan lassulás mintha töltene be dolgokat. Én vram fogyásra tippelek de megnézem msi afterburnerrel mit mutat. Nem folyamatosan alacsony az fps hanem keményen beesik.
Procim egy szálon gyenge, skylake de a cyberpunk meg pont szereti a sok magot az meg van benne egy pár.[ Szerkesztve ]
-
-
-
S_x96x_S
addikt
válasz Raymond #44638 üzenetére
köszi, igen , az a fiscal year mindig megtéveszt,
ettől függetlenül két különböző üzletág összehasonlításának nem sok értelme van.viszont Q3-ra van előrejelzés:
"NVIDIA's outlook for the third quarter of fiscal 2025 is as follows: Revenue is expected to be $32.5 billion, plus or minus 2%."[ Szerkesztve ]
Mottó: "A verseny jó!"
-
félisten
válasz Raymond #44752 üzenetére
Rákerestem ott is valami 6% utalvány kóddal kerül annyiba, ha jól látom [link] a 750 euros ár, bár lehet nem jól nézem az oldalt.[ Szerkesztve ]
"A számítógépek hasznavehetetlenek. Csak válaszokat tudnak adni." (Pablo Picasso) "Never underrate your Jensen." (kopite7kimi)
-
PuMbA
titán
válasz Raymond #44850 üzenetére
A doksi szerint DXR-en kívüli, azaz egyedi BVH csak konzolon és PC-n DXR 1.1 támogatás hiányában van:
"Using DXR 1.1 with inline trace for PC, and a custom BVH implementation for
consoles and PC hardware without RT support"Amivel teljesítményt spórolnak az ez:
"It’s a hybrid between screen-space and hardware ray tracing, as well as relying on
ray-traced probes"[ Szerkesztve ]
-
hahakocka
senior tag
válasz Raymond #44970 üzenetére
Ha UV -zve vagy butítva adják ki akkor nem kérhettek volna el annyit amit még ma is. Minden cég a profitra megy minél nagyobb annál csak jobb. Persze konkurencia se volt az Ultra csúcs szinten de akkor is olcsóbb lehetett volna ez esetben de az meg NV nek fájt volna.
Kíváncsi leszek hogy az Intel marad e a sok vramnál meg az AMD vagy az olcsóság miatt abból is levesznek. Míg vajon NV- nél növelik e az 5060-5080 szegmesnben?[ Szerkesztve ]
-
X2N
őstag
válasz Raymond #45190 üzenetére
Ezek csak kifogások, régen ilyen nem volt mint manapság, a 60Hz-es monitorral is vertem a mezőnyt TDM-be CS:S-ban még egy deagle/scout-al is úgy hogy össze vissza tört a kép, maga a játék 350fps-el ment, jobb lett volna a szememnek egy 300Hz-es monitorral? Persze, de maga a netkód 64, nagyon max 128 tickrates szerveren fut, úgyhogy hiába látok több frame-t nem lesz pontosan ott ahol látod az ellenfél az interpoláció miatt.
[ Szerkesztve ]
-
nagyúr
válasz Raymond #45217 üzenetére
Igen, vszleg lesznek orbitális számok. Én a sima raszteres teljesítményre "jósoltam", DLSS nélkül.
@fLeSs: 1000 USDs árat csak akkor tartok elképzelhetőnek, ha nagyon gatya lesz a sebességnövekedés. Sztem a jelentősen megnövelt TDP-ből (ha igaz) órajelet csinálnak, ami elég megbízhatóan hozza a plusz teljesítményt. Meglássuk.
[ Szerkesztve ]
"We put all our politicians in prison as soon as they're elected." "Why?" "It saves time."
Új hozzászólás Aktív témák
A topikban az OFF és minden egyéb, nem a témához kapcsolódó hozzászólás gyártása TILOS!
MIELŐTT LINKELNÉL VAGY KÉRDEZNÉL, MINDIG OLVASS KICSIT VISSZA!!
A topik témája:
Az NVIDIA éppen érkező, vagy jövőbeni új grafikus processzorainak kivesézése, lehetőleg minél inkább szakmai keretek között maradva. Architektúra, esélylatolgatás, érdekességek, spekulációk, stb.
Állásajánlatok
Cég: Axon Labs Kft.
Város: Budapest
Cég: PCMENTOR SZERVIZ KFT.
Város: Budapest