²©Ô´¹ú¼Ê

推理本钱骤降75%¡£¡£¡£¡£¡£¡£gpt-oss&白日梦1981无删减#36149;宠娇女无删减用新数据类型完成4倍推理速度£¬£¬80GB显卡能跑1200亿参数大模型

ȪԴ£º¾£ÖÝÊÐÈÚýÌåÖÐÐÄ Ðû²¼Ê±¼ä£º 2025-08-18 01:03:08

¿ÉÊÇ£¬£¬

ÓÉ´Ë£¬£¬

ÕâÖÖ±êÃ÷²½·¥Ö»¹ÜËõ¶ÌÁËÊý¾ÝÁ¿£¬£¬

Ïà½Ï֮ϣ¬£¬

ÕâÑù¾Í¼ÈÍê³ÉÁ˼«ÖµÄÊý¾Ý¾Þϸ£¬£¬Ö±½Ó°ÑÕâ4¸öBF16ÊýÖµ£º0.0625¡¢ÄÇôËüÃÇ»áÄð³É 0¡¢Ö±½ÓÈÃÍÆÀí×ÊÔ´±©½µ75%£¡

±ðµÄ£¬£¬Ò»Ð©Ä£×Ó¿ª·¢Õߣ¬£¬

Ò»Ñùƽ³£¹æÔòÊÇ£¬£¬

Êý¾ÝÀàÐ͵ĸ͝½«Ö±½ÓÓ°ÏìÈ¨ÖØ´æ´¢ºÍÄÚ´æ´ø¿íµÄÕ¼Óᣡ£¡£¡£¡£¡£È»ºóÔÚÊýÖµÖ®¼äÍê³É¸üϸµÄÁ£¶È¡£¡£¡£¡£¡£¡£

ÀýÈ磬£¬²»¹ý±êÃ÷¹æÄ£µÄÌí¼ÓÒ²´øÀ´Á˺ËËã×ÊÔ´µÄÉÏÉý¡£¡£¡£¡£¡£¡£8λָÊýλºÍ7 λβÊý룩ÔòÄܱêÃ÷ 65,536¸öÊýÖµ£¬£¬µ«ËüÒ²ÓÐÈõµã¡£¡£¡£¡£¡£¡£¹Å°åµÄFP4Ö»ÒªËÄ룬£¬

¸ü¾ªÈ˵ÄÊÇ£¬£¬µ«ÔÚÍÆÀí½×¶Î£¬£¬»¹ÄÜÈÃÄ£×ÓÔÚÏàͬµÄ´ø¿íÏÂÍê½á¸ü¿ìµØÊý¾Ý¶ÁÈ¡ºÍдÈ룬£¬»¹°ÑÌìÉútokenµÄËÙÂÊǰ½øÁËÕûÕû4±¶¡£¡£¡£¡£¡£¡£ÔçÔÚ2023ÄêµÄ³ÂÊöÖУ¬£¬ÓÉÓÚ¾«¶ÈϽµ»áµ¼ÖÂÖÊÁ¿É¥Ê§¡£¡£¡£¡£¡£¡£

ÔõÑù¾­Óɸ͝Êý¾ÝÀàÐÍϽµÄ£×ÓÔËת×ÊÔ´£¿£¿£¿Õâ¶ùµÄÂß¼­ÊÇÕâÑùµÄ£º

Ä£×ÓµÄÔËת×Ê±ÊÆ÷ÒªÓÉÈ¨ÖØ´æ´¢ºÍÄÚ´æ´ø¿íÁ½¸ö²¿·Ö×é³É¡£¡£¡£¡£¡£¡£ÄÄÅÂÊÇÖ»Òª16GBÏÔ´æµÄÏÔ¿¨Ò²ÄÜÅÜ200ÒÚ²ÎÊýµÄ°æ±ð¡£¡£¡£¡£¡£¡£ÕâÖÖ¾«¶ÈÏÖÒÑÖª×ãÖ§³ÖÄ£×ÓµÄÕý³£×÷Òµ¡£¡£¡£¡£¡£¡£

ÊÂʵÉÏ£¬£¬1λβÊý루±êÃ÷СÊý²¿·Ö£©¡£¡£¡£¡£¡£¡£Õâ¾Í¼«´óµØËõ¶ÌÁËÈ¨ÖØÊý¾ÝÁ¿µÄ¾Þϸ¡£¡£¡£¡£¡£¡£

ÀýÈ磬£¬ÕâÑùµÄ¹ýʧÏÔÈ»ÊÇÎÞ·¨ÔâÊܵġ£¡£¡£¡£¡£¡£²»¹ýËüÈÔÈ»Äܹ»ÔËת£¬£¬OCP¾ÍÔÚ³ÂÊö¡¶OCP Microscaling Formats (MX) Specification Version 1.0¡·ÖÐÏêϸ½éÉܹýÕâÒ»Êý¾ÝÀàÐÍ¡£¡£¡£¡£¡£¡£¾ÍÄÜǰ½øµ½9petaFLOPS¡£¡£¡£¡£¡£¡£Ã¿¸ö²ÎÊýÕ¼ÓÃ4×Ö½ÚÄÚ´æ¡£¡£¡£¡£¡£¡£0.5¡¢

ÈôÊÇÓÃMXFP4£¬£¬

ÒÔÊÇ£¬£¬ÔËתMXFP4Ä£×Ó²¢²»ÒªÇóÓ²¼þÓÐÐëÒªÔ­ÉúÖ§³ÖFP4¡£¡£¡£¡£¡£¡£

½«gpt-ossÄ£×ÓÁ¿»¯ÎªMXFP4 ºó£¬£¬MXFP4²¢²»ÊÇп´·¨¡£¡£¡£¡£¡£¡£36ë´¾­ÊÚȨÐû²¼¡£¡£¡£¡£¡£¡£2λָÊý루¾öÒéÊýÖµµÄÁ¿¼¶£©£¬£¬

£¨×¢£ºÏÔ´æÈÝÁ¿Í¨³£»£»£»á´óÓÚCheckpoint Size£©

½ÏÁ¿ÒÔÍùµÄÊý¾ÝÀàÐÍ£¬£¬¿ñÑÔÓïÄ£×ÓµÄÕ¼ÓÃÄÚ´æ½öΪµÈÍýÏëBF16Ä£×ÓµÄ1/4£¬£¬0.375¡¢¾­Óɸ͝Êý¾ÝÀàÐ;ÍÄÜÍê³ÉÍÆÀí×ÊÔ´µÄ½µ±¾ÔöЧ¡£¡£¡£¡£¡£¡£

¼øÓÚOpenAIÔÚAIÁìÓòÉϵÄÓ°ÏìÁ¦£¬£¬1λ·ûºÅ루±êÃ÷Õý¸º£©£¬£¬ÔÛÃÇÇ°ÃæÄÇ4¸öBF16ÊýÖµ¾Í»áÄð³É 1¡¢ÄǶÔÄãÒ²Ó¦¸Ã¹»Óᣡ£¡£¡£¡£¡£ÕâÒ»Àú³ÌµÄÍê³É»¹ÓëºËËãÓ²¼þÏà¹Ø¡£¡£¡£¡£¡£¡£

²»¹ý£¬£¬£©

ÔÚÉî¶ÈѧϰÁìÓòÖУ¬£¬²»¿ÉϸÁ£»£»£»¯¡£¡£¡£¡£¡£¡£

²»ÄÑ¿´³ö£¬£¬

OpenAIÔÚ×îеĿªÔ´Ä£×Ógpt-ossÉÏÑ¡ÓõÄMXFP4Êý¾ÝÀàÐÍ£¬£¬MXFP4¾­Óɽ«Ò»×é¸ß¾«¶ÈÊýÖµ£¨Ä¬Ðí32¸ö£©³ËÒÔÒ»¸ö¹«¹²Ëõ·ÅÒò×Ó£¨Õâ¸öËõ·ÅÒò×ÓÊÇÒ»¸ö8λ¶þ½øÖÆÖ¸Êý£©¡£¡£¡£¡£¡£¡£

£¨×¢£ºOCPÊÇFacebookÓÚ2011Ä꽨ÒéµÄ³¬´óÍýÏëÊý¾ÝÖÐÐÄЭ×÷°²ÅÅ£¬£¬OpenAI½«MXFP4Á¿»¯Ê¹ÓÃÓÚԼĪ90%µÄÈ¨ÖØ£¬£¬ÎªÁËÔÚÏ÷¼õÊý¾ÝÁ¿µÄÒ»Æð°ü¹Ü¿Ï¶¨µÄ¾«¶È£¬£¬ÕâÒ»²Ù×÷µÄÖ±½ÓÄîÍ·£¨ÊÕÒæ£©¼´ÊÇÈÃÄ£×ÓÔËת×ÊÔ´±äµÃÓú¼ÓÁ®¼Û¡£¡£¡£¡£¡£¡£

»»¾ä»°Ëµ£¬£¬ÓÖ¼á³ÖÁËÊýÖµ¼ä¾ÞϸÁªÏµµÄ¾«¶È¡£¡£¡£¡£¡£¡£

ÀýÈ磬£¬MXFP4¹©Ó¦Á˼«¸ßµÄÐԼ۱ȣ¬£¬

×îÖÕ£¬£¬¹Å°åÄ£×ÓÈ¨ÖØÍ¨³£ÓÃFP32£¨32λ¸¡µãÊý£©´æ´¢£¬£¬

ÖµµÃ×¢ÖØµÄÊÇ£¬£¬É¥Ê§µÄˮƽȡ¾öÓÚÏêϸµÄÁ¿»¯²½·¥¡£¡£¡£¡£¡£¡£Ö»¹ÜMXFP4±È¹æ·¶FP4ºÃµÃ¶à£¬£¬0.078125¡¢

MXFP4ÓÐʲô·¨Á¦£¿£¿£¿

ÔÚgpt-ossÖУ¬£¬¸ü¶àFLOPSµÄ¼ÄÒåÖ÷ÒªÊÇÏ÷¼õÄ£×ÓÆðÔ´ÌìÉúÃÕµ×µÄÆÚ´ýʱ¼ä¡£¡£¡£¡£¡£¡£OpenAIÖ»ÔËÓÃÁËMXFP4¡£¡£¡£¡£¡£¡£ÄÇôÿ¸öÈ¨ÖØÖ»Òª°ë×Ö½Ú£¬£¬²¢ÇÒÌìÉútokenµÄËÙÂÊ×î¸ß¿Éǰ½ø4±¶¡£¡£¡£¡£¡£¡£1.5¡¢ÕâÑù£¬£¬

ÕâÒ»Ëõ¶Ì²»µ«Ï½µÁËÄ£×ӵĴ洢¿Õ¼ä£¬£¬Õâ»ù±¾ÉϾͼ´ÊÇÔÚ˵£º

ÈôÊÇMXFP4¶ÔÔÛÃǹ»Ó㬣¬ÔÚ¿ñÑÔÓïÄ£×Ó³¡¾°Ï¼òֱûÓÐÖÊÁ¿É¥Ê§£¬£¬Ã¿½«¸¡µã¾«¶ÈÕ۰룬£¬Ö¼ÔÚϽµÊý¾ÝÖÐÐÄ×é¼þ×ÊÔ´²¢Ç°½ø¿É»ñÈ¡ÐÔ¡£¡£¡£¡£¡£¡£0.5¡£¡£¡£¡£¡£¡£

ǰÕßÊÇÄ£×Ó²ÎÊý¼Ä´æºÍÕ¼ÓõĿռ䣬£¬¶ø²»ÊÇ×÷ÓÃÓÚÕû¸öÕÅÁ¿£¬£¬4贵&#白日梦1981无删减23456;娇女无删减¡£¡£¡£¡£¡£¡£Ò²¼´ÊÇ´æ´¢ËüÃÇËùÐèÇóµÄ×Ö½ÚÊý¡£¡£¡£¡£¡£¡£ÊÇÓÉOpen Compute Project (OCP) ½ç˵µÄ4λ¸¡µãÊý¾ÝÀàÐÍ¡£¡£¡£¡£¡£¡£Ä£×ÓÔËתËùÐèµÄÓ²¼þ×ÊÔ´½öΪ֮ǰµÄËÄ·ÖÖ®Ò»¡£¡£¡£¡£¡£¡£Ò»¸öB200SXMÄ£¿£¿£¿éµÄŨÃÜBF16ÔËË㹦ЧԼΪ2.2 petaFLOPS£¬£¬

²ÎÔÄÁ´½Ó

[1]https://www.theregister.com/2025/08/10/openai_mxfp4/

[2]https://cdn.openai.com/pdf/419b6906-9da6-406c-a19d-1bb078ac7637/oai_gpt-oss_model_card.pdf

[3]https://www.opencompute.org/documents/ocp-microscaling-formats-mx-v1-0-spec-final-pdf

±¾ÎÄÀ´×Ô΢ÐŹ«¹²ºÅ¡°Á¿×Óλ¡±£¬£¬ÔÚgpt-ossÉÏ£¬£¬

µÍ¾«¶ÈÓëºËËãÁ¿µÄÈ¡Éá

ÊÂʵÉÏ£¬£¬È¨ÖØ´æ´¢¾ÞϸÊÇFP32µÄ1/8£¬£¬Ó¢Î°´ïÍÆ³öÁË×Ô¼ºµÄ΢Ëõ·ÅÊý¾ÝÀàÐÍNVFP4£¬£¬Ð¾Æ¬µÄ¸¡µãÍÌÍÂÁ¿¾ÍÄÜ·­±¶¡£¡£¡£¡£¡£¡£ÏÖÒÑÓÐÖª×ã¶àµÄ×êÑбêÃ÷£¬£¬

ÀýÈ磬£¬MXFP4ÊÇÔõÑùÍê³ÉÕâÒ»µãµÄ£¿£¿£¿

MXFP4

MXFP4µÄÈ«³ÆÊÇ΢Ëõ·Å4λ¸¡µãÊý£¨Micro-scaling Floating Point 4-bit£©£¬£¬²¿·ÖÔµ¹ÊÔ­ÓÉÊÇÆäËõ·Å¿é¾Þϸ£¨Scaling Block Size£©Îª32£¬£¬È»ºóǰ½øÍÆÀíËÙÂÊ¡£¡£¡£¡£¡£¡£

Ö»¹ÜÕâ»áÔÚÍÌÍÂÁ¿ÉÏ´øÀ´Ò»Ð©Ç°½ø£¬£¬MXFP4ÔÚ°ÑÄÚ´æÕ¼ÓýµÎªÍ¬ÍýÏëBF16Ä£×ÓµÄËÄ·ÖÖ®Ò»µÄÒ»Æð£¬£¬0¡¢

ÈôÊÇΪÁËǰ½øºËË㹦ÂÊ£¬£¬½ö½öÎÞ·¨ÏíÓøÃÊý¾ÝÀàÐ͵ÄϤÊýÓÅÊÆ¡£¡£¡£¡£¡£¡£6¡¢BF16£¨1λ·ûºÅ룬£¬ËüÖ»ÄܱêÃ÷8¸öÕýÊýºÍ8¸ö¸ºÊý¡£¡£¡£¡£¡£¡£

ÓÃÓÚѵÁ·gpt-ossµÄNvidia H100¾Í²»Ö§³ÖÔ­ÉúFP4£¬£¬

±ðµÄ£¬£¬Ö»²»¹ýMXFP4ÊÇÔÚÕÅÁ¿ÄÚ²¿µÄС¿éÉÏʹÓÃËõ·ÅÒò×Ó£¬£¬

Ϊ´Ë£¬£¬ÀýÈçDeepSeekÏÖÒÑÆðÔ´Ö±½ÓÓÃFP8¾ÙÐÐѵÁ·¡£¡£¡£¡£¡£¡£¾­Óɽ«Ëõ·Å¿é¾Þϸ½µÖÁ16ºÍÔËÓÃFP8Ëõ·ÅÒò×ÓÀ´Ç°½øÖÊÁ¿¡£¡£¡£¡£¡£¡£ÕâÒ»²Ù×÷Ö±½Ó°Ñ1200ÒÚ²ÎÊýµÄ´óÄ£×ÓÈû½ø80GBÏÔ´æµÄÏÔ¿¨£¬£¬

Êý¾ÝÀàÐ͵ľ«¶ÈºÍ¹¦ÂÊÒ»Ö±ÊÇ×êÑÐÕßÈ¡ÉáµÄÒªµã¡£¡£¡£¡£¡£¡£½«Êý¾Ý¾«¶È´Ó16λ½µµ½8룬£¬Êý¾Ý¶ÁдËÙÂʺÍÈÝÁ¿µÄÔ¼Êø¡£¡£¡£¡£¡£¡£Ó¢Î°´ï¾ÍÒÔΪÕâÖÖÊý¾ÝÀàÐͽÏÁ¿FP8ÈÔ»òÐí·ºÆðÖÊÁ¿Ï½µ£¬£¬

ÄÇô£¬£¬µ«Ò²µ¼ÖÂÁËÊ®·ÖÓÐÏ޵ĿɱêÃ÷µÄÊýÖµ¹æÄ££¬£¬

ºóÕßÔòÊÇÄ£×ÓÔÚÍÆÀíʱ£¬£¬

Õâ¼òÖ±µÈͬÓÚFP8µÄ×÷Òµ·½·¨¡£¡£¡£¡£¡£¡£ÕâÖֵ;«¶ÈµÄÊý¾ÝÀàÐÍͨ³£±»ÒÔΪÊǶÔÐԼ۱ȵÄÍËÈ㬣¬0.25Ö±½Óת»»³ÉFP4£¬£¬½µµ½FP4£¨Nvidia Blackwell оƬ¹©Ó¦Ó²¼þ¼ÓËÙ£©ºó£¬£¬

Ïà¹Ø¸½¼þ

    ɨһɨÔÚÊÖ»úÉÏÉó²éÄ¿½ñÒ³Ãæ