Új hozzászólás Aktív témák
-
S_x96x_S
addikt
Valóság meg : [Analysis’ Hardware Benchmarking shows NVIDIA achieving a ~5x tokens-per-dollar advantage over TPU v6e (Trillium), and a ~2x advantage over MI300X, in our key inference cost metric]
ha google 5x sebességre lép előre és ugyan ezen az áron adja mint a V6e modellt ( amit kétlek)akkor is csak utolérné az Nvidia H100 gyorsítót nem hogy előnye lenne.
A kedvenc szakértőd ( "Dylan Patel" )
az általam korábban linkelt cikkben
egy külön bekezdést szentelt
az általad linkelt tpu bench kritikájának.https://newsletter.semianalysis.com/p/tpuv7-google-takes-a-swing-at-the?open=false#%C2%A7vllm-tpu-benchmarks-are-not-relevant-yet
"""
vLLM TPU Benchmarks are not relevant yet
This week, there was an new inference benchmark on TPUv6e that dropped claiming that TPUv6e has 5x worst performance per dollar than NVIDIA GPUs. We disagree mainly due to 2 reasons. First of all, this is benchmark is on vLLM on TPUs which was only released an couple month ago thus does not yet have optimized performance. Google internal Gemini workloads & Anthropic workloads work on an internal custom inference stack that has better perf per TCO than NVIDIA GPUs.
Secondly, Aritifical Analysis’s cost per million tokens is using the list price of $2.7/hr/chip for TPUv6e. No major customers of TPUs is paying anywhere close to that much for TPUv6e given the BOM is a tiny fraction of the H100. As everyone knows, most clouds have an high ball list price such that their account sales executives can do “car salesman” tactics and give massive discounts so that the customer thinks they are getting a good deal. The SemiAnalysis AI TCO Model tracks the acutal market rental price of TPUs across all the various contract lengths (1 month, 1 year, 3 years, etc).
""""
Új hozzászólás Aktív témák
A topikban az OFF és minden egyéb, nem a témához kapcsolódó hozzászólás gyártása TILOS!
Megbízhatatlan oldalakat ahol nem mérnek (pl gamegpu) ne linkeljetek.
- Hogyan verte le egy telefon chip az egész laptop ipart? – x86 vs ARM
- Telekom mobilszolgáltatások
- Xiaomi Watch 5 - kínai időszámítás
- Xbox tulajok OFF topicja
- Kormányok / autós szimulátorok topikja
- Kerékpárosok, bringások ide!
- AMD K6-III, és minden ami RETRO - Oldschool tuning
- Gumi és felni topik
- Kávé kezdőknek - amatőr koffeinisták anonim klubja
- Metal topik
- További aktív témák...
- GTX 1050 Ti Windforce OC 4GB
- XFX Swift AMD Radeon RX 9070 XT 16G - alig használt - garancia: ALZA.HU 2028 decemberéig
- BESZÁMÍTÁS! ASUS ProArt RTX 4060 8GB videokártya garanciával hibátlan működéssel
- BESZÁMÍTÁS! EVGA XC3 ULTRA RTX 3070Ti 8GB videókártya garanciával hibátlan működéssel
- BESZÁMÍTÁS! Asus Dual RTX 3070 Ti 8GB OC videókártya garanciával hibátlan működéssel
- Azonnali készpénzes Intel i5 i7 i9 8xxx 9xxx processzor felvásárlás személyesen / csomagküldés
- Samsung Galaxy A56 5G 128GB, Kártyafüggetlen, 1 Év Garanciával
- GYÖNYÖRŰ iPhone 13 128GB Red-1 ÉV GARANCIA - Kártyafüggetlen, MS4373, 100% Akkumulátor
- Apple MacBook Neo 13" 512GB Touch ID Indigó Bontatlan / 27% áfás ár
- Xiaomi Redmi Note 12 Pro+ 256GB, Kártyafüggetlen, 1 Év Garanciával
Állásajánlatok
Cég: Laptopműhely Bt.
Város: Budapest
