ÄúÏÖÔÚµÄλÖãºÊ×Ò³
¡°ÎÒÕæµÄÑá¶ñÁË¿´µ½ÄÇЩ¼±ÓÚÇó³ÉµÄ¿Æ¼¼Ê×´´¹«Ë¾£¬£¬£¬ÎªÁËͶºÏ·çͶ¶øÔÚÊý¾ÝÉÏ˵»Ñ£¬£¬£¬»¹ÌùÉÏ¡®SOTA¡¯µÄ±êÇ©¡£¡£¡±ÓÐÍøÓÑͲۡ£¡£
ÊÂÇéÔ´ÓÚ¸ßÈËÆø¿ªÔ´ÖÇÄÜÌ廨ÒäÏîÄ¿ Mem0 ÔÚ½ñÄê 4 ÔÂβÐû²¼µÄһƪÂÛÎÄ¡£¡£ÂÛÎÄÖУ¬£¬£¬¸ÃÏîÄ¿ÍŶÓΪ¿ÉÀ©Õ¹µÄ¡¢ÒÔ»ØÒäΪÖÐÐĵļܹ¹ Mem0 Ìá³öÁËÔöÇ¿°æ±ð£¬£¬£¬²¢Ðû³ÆÔÚ LOCOMO ÉÏ»÷°ÜÁËËùÓÐÈË£¬£¬£¬Æä¼ä£¬£¬£¬Mem0 ÔÚ ¡°LLM-as-a-Judge¡± Ä¿µÄÉÏÏà½ÏÓÚ OpenAI Ìá¸ßÁË 26%¡£¡££¨ÂÛÎĵص㣺https://arxiv.org/abs/2504.19413£©
ÍâµØÊ±¿Ì 8 Ô 13 ÈÕ£¬£¬£¬ ÁíÒ»¸ö¸ßÈËÆøµÄÖÇÄÜÌ廨Òä½á¹¹ MemGPT µÄ¿ª´´ÍÅ¶Ó Letta AI £¬£¬£¬ÆäÁªºÏ¿ª´´È˼æ CTO Sarah Wooders ¶Ô´Ë½ÒÆÆÖ¸¿Ø£º
¼¸¸öÔÂǰ£¬£¬£¬Mem0 Ðû²¼ÁË MemGPT µÄ»ù×¼¿¼ÊÔÊý¾Ý£¬£¬£¬²¢Ðû³ÆÔÚ»ØÒä·½ÃæµÖ´ïÁË ¡°SOTA¡± ˮƽ¡£¡£
Ï£ÆæµÄÊÇ£¬£¬£¬ÎÒ³¹µ×²»ÖªµÀËûÃǾ¿¾¹ÊÇÔõÑùÅÜÕâ¸ö»ù×¼¿¼ÊԵ쬣¬£¬ÈôÊÇ²î³Ø MemGPT ×öÑÏÖØÐÞÕý£¬£¬£¬Õâ¸ö¿¼ÊÔ»ù´¡ÎÞ·¨Íê½á£¨ËûÃÇûÓлØÓ¦ÔÛÃǹØÓÚÊÔÑéÏêϸÔËת²½·¥µÄÎÊѯ£©¡£¡£
arXiv ²¢²»ÊǾÓÉÙÉÐÐÆÀ¶¨µÄÇþµÀ£¬£¬£¬ÒÔÊDz»ÐÒµÄÊÇ£¬£¬£¬½üÄêÀ´¹«Ë¾Äܹ»ËæÒâÐû²¼ÈκÎËûÃÇÏëÒªµÄ¡°×êÑС±Ð§¹ûÀ´×öÊг¡ÓªÏú¡£¡£
ÔÛÃǺÜÇáËɾÍÓÃһЩ¼òÂÔµÄÎļþϵͳ¹¤¾ßÓâÔ½ÁËËûÃǵĻù×¼Êý¾Ý¡ª¡ªÕâÒ²ÆÊÎöÕâ¸ö»ù×¼¿¼ÊÔ×ÔÉí²¢Ã»ÓÐÌ«´ó¼ÄÒå¡£¡£
¡°Mem0 Ðû³ÆËûÃÇÔÚ LOCOMO ÉÏ»÷°ÜÁËËùÓÐÈË£¬£¬£¬µ«Ð§¹û·¢Ã÷ËûÃdz¹µ×°Ñ¾ºÕùµÐÊÖµÄÍê½á¸ãÔÒÁË¡£¡£È»ºó»¹ÓÃÕâЩÔã¸âµÄЧ¹ûÀ´Ö¤Êµ×Ô¼ºµÄÓÅÊÆ¡£¡£±È¼° Letta ºÍ Zep °´×¼È·²½·¥ÅÜÁË»ù×¼¿¼ÊԺ󣬣¬£¬Á½Õߵĵ÷ֶ¼±È Mem0 µÄ×î¼ÑЧ¹ûºá¿ç 10%¡£¡£¡±ÍøÓѵãÆÀµÀ£¬£¬£¬¡°Õâ¸öÖ°ÒµÀïµÄ¡®¿ÕÆø²úÆ·¡¯¶àµ½ÀëÆ×¡£¡£ÎÒÏàʶΪÁËÄõ½·çͶ£¬£¬£¬ÆóÒµ»á¿äÕŹ¦Ó㬣¬£¬µ«ÔÚ¿ÆÑÐÂÛÎÄÀï˵»Ñ×ÅʵÊǿɱ¯¡£¡£¡±
Mem0 ºÍ Letta µÄ½µÉú¶¼ÊÇΪÁË´¦Öóͷ£´óÄ£×ӵij¤Ê±¿Ì»ØÒäÎÊÌâ¡£¡£
×Ô GPT-4 ÃæÊÀÒÔÀ´£¬£¬£¬´óÄ£×ÓÒ»Ö±ÊÜÏÞÓÚÀο¿µÄÉÏÏÂÎij¤¶È¡£¡£Ã»Óг¤Ê±¿Ì»ØÒ䣬£¬£¬´óÄ£×ÓºÍÖÇÄÜÁìÅöÃæÁÙÏÔ×ÅÔ¼Êø£ºËüÃÇ»áÒÅÍüÐÅÏ¢£¬£¬£¬ÎÞ·¨Ëæ×Åʱ¿ÌѧϰºÍ¸ÄÉÆ£¬£¬£¬²¢ÇÒÔÚ³¤Ê±¿Ì¡¢ÔÓÂÒµÄʹÖÀÖлáʧµôÄ¿µÄ¡£¡£
Ϊ´Ë£¬£¬£¬ÔÚ 2023 Ä꣬£¬£¬¼ÓÖÝ´óѧ²®¿ËÀû·ÖУ£¨UC Berkeley£©µÄ×êÑÐÍŶÓÌá³öµÄÒ»ÖÖÁ¢Òìʽϵͳ MemGPT£¬£¬£¬ ѧϰ¹Å°å²Ù×÷ϵͳ£¨OS£©µÄÀíÄ£¬£¬Òý½øÁËÖÇÄÜÌåµÄ»ØÒä°ìÀí£¬£¬£¬¾Óɹ¹½¨»ØÒä²ã¼¶£¬£¬£¬ÈÃÖÇÄÜÌå×Ô¶¯°ìÀíÄÄЩÐÅÏ¢±£±£´æ¼´Ê±ÉÏÏÂÎÄ£¨ÖÐÐÄ»ØÒ䣩ÖС¢ÄÄЩ´æ´¢ÔÚÍⲿ²ã£¨¶Ô»°»ØÒä¡¢¹éµµ»ØÒäºÍÍⲿÎļþ£©£¬£¬£¬ÒԱ㰴Ðè¼ìË÷¡£¡£ÕâÑù£¬£¬£¬ÖÇÄÜÌåÄܹ»ÔÚÀο¿µÄÉÏÏÂÎÄ´°¿ÚÄÚ¼á³ÖÎÞÏ޵ĻØÒäÈÝÁ¿¡£¡£
MemGPT µÄ×êÑÐѸËÙÒýÆðÉçÇøÖØÊÓ£¬£¬£¬MemGPT ÂÛÎĵÄÌû×ÓÔÚ Hacker News Ö÷Ò³ÉÏÍ£ÁôÁË 48 Сʱ£¬£¬£¬¿ªÔ´ºóÒÑÀÛ»ý 17.8k stars¡£¡£
Ëæ×Å¿ªÔ´ÏîÄ¿µÄÍÆ½ø£¬£¬£¬ÍŶӽ¨ÉèÁËÃûΪ Letta µÄ¹«Ë¾£¬£¬£¬¼ÌÐø±£»£»£»£»¤ MemGPT ¿ªÔ´½á¹¹£¬£¬£¬²¢ÍƽøÆäÉÌÒµ»¯ºÍ¹¤³Ì»¯Â䵨¡£¡£ÔÀ´µÄ MemGPT Ò²½ú¼¶³ÉÁË Letta¡£¡£
Õâ¼ÒÓɲ®¿ËÀû²©Ê¿Éú Sarah Wooders ºÍ Charles Packer ½¨ÉèµÄ AI Ê×´´¹«Ë¾±¸ÊÜÆÚ´ý¡£¡£Letta È¡µÃÁËÓÉ Felicis µÄ Astasia Myers ÁìͶµÄ 1000 ÍòÃÀÔªÖÖ×Ó×ʽ𣬣¬£¬±¾ÂÖ¹ÀֵΪ 7000 ÍòÃÀÔª¡£¡£±ðµÄ£¬£¬£¬»¹»ñµÃÁËÈ˹¤ÖÇÄÜÁìÓòһϵÁÐÌìʹͶ×ÊÈ˵ÄÖ§³Ö£¬£¬£¬Æä¼ä°üÀ¨¹È¸èµÄ Jeff Dean¡¢Hugging Face µÄ Clem Delangue¡¢Runway µÄ Crist¨®bal Valenzuela ºÍ Anyscale µÄ Robert Nishihara µÈ¡£¡£
ÏÖÔÚ£¬£¬£¬Ðí¶àÖÇÄÜÌåϵͳ¶¼Íê½áÁË MemGPT µÄÍýÏë¡£¡£
Mem0 ÔòÊÇÓÉÓ¡¶È¹¤³Ìʦ Taranjeet Singh ºÍ Deshraj Yadav ½¨É裬£¬£¬Ô´ÓÚËûÃǹ¹½¨¿ªÔ´¼ìË÷ÔöÇ¿ÌìÉú (RAG) ½á¹¹ Embedchain µÄÂÄÀú£¬£¬£¬¸Ã½á¹¹ÏÂÔØÁ¿ÓâÔ½ 200 Íò´Î¡£¡£
ÒÀ¾Ý YC µÄ½éÉÜ£¬£¬£¬Singh Ôø×÷ΪÊ×λÔöÌí¹¤³Ìʦ¼ÓÈë Khatabook£¨YC S18£©£¬£¬£¬²¢Ñ¸ËÙÌáÉýΪ¸ßµÈ²úƷ˾Àí¡£¡£ËûµÄÈí¼þ¹¤³ÌÖ°ÒµÉúÑÄʼÓÚ Paytm£¨Ó¡¶ÈµÄ PayPal£©£¬£¬£¬Ç×ÀúÁËÆäѸËÙÐËÆð³ÉΪÖÚËùÖÜÖªµÄÆ·ÅÆ¡£¡£Ëû¿ª·¢ÁËÒ»¿îÓÉ AI Çý¶¯µÄ½ÌÓýÔËÓ㬣¬£¬ÔøÔÚ Google I/O É϶Á³¡£¡£ËûÓë Deshraj Ò»Æð½¨ÉèÁË EvalAI£¬£¬£¬ÕâÊÇÒ»¸ö¿ªÔ´µÄ Kaggle È¡´úÇþµÀ£¬£¬£¬GitHub ÉÏÈ¡µÃÁË 1.6K stars¡£¡£Ëû»¹½¨ÉèÁËÊ׸ö GPT ÔËÓÃÉÌÆÌ£¬£¬£¬Óû§ÍýÏëÍ»ÆÆ 100 Íò¡£¡£
Yadav ÔòÆÕ±éÖØÊÓÈ˹¤ÖÇÄܺͻúеѧϰ»ù´¡ÉèÊ©ÁìÓò£¬£¬£¬ÔøÏòµ¼ÌØË¹尿流行色情À×Ô¶¯¼ÝÔ¦µÄ AI ÇþµÀ£¬£¬£¬看曰韩色情大片Ö§³ÖÌØË¹ÀÈ«×Ô¶¯¼ÝÔ¦¿ª·¢ÖеĴóÍýÏëѵÁ·¡¢Ä£×ÓÆÀ¼Û¡¢¼à¿ØºÍ¿ÉÊÓ²ìÐÔ¡£¡£ÔÚ´Ë֮ǰ£¬£¬£¬Deshraj ÔÚÇÇÖÎÑÇÀí¹¤Ñ§ÔºÍê½á˶ʿÂÛÎÄʱ½¨ÉèÁË¿ªÔ´»úеѧϰÇþµÀ EvalAI£¬£¬£¬²¢ÔÚ CVPR¡¢ECCV¡¢AAAI µÈÉÏÐû²¼¹ýÂÛÎÄ¡£¡£
Mem0 ÒÔΪ£¬£¬£¬´¿´âµØÀ©Õ¹Ä£×ÓµÄÉÏÏÂÎÄ´°¿ÚÖ»»áÍÆ³ÙÎÊÌâµÄ±¬·¢£¬£¬£¬Ä£×Ó»á±äµÃ¸üÂý¡¢×ÊÔ´¸ü¸ß£¬£¬£¬²¢ÇÒÈÔÈ»»áÊèºöÒªº¦Ï¸½Ú¡£¡£ÍŶÓÌôÑ¡¾ÓÉÒ»¸öͨÓᢿÉÀ©Õ¹µÄ»ØÒä¼Ü¹¹À´´¦Öóͷ£ÎÊÌ⣬£¬£¬Mem0 ³äµ±ÁË AI ÔËÓóÌÐòºÍ´óÄ£×ÓÖ®¼äµÄ»ØÒä²ã£¬£¬£¬Äܹ»¶¯Ì¬µØ´ÓÓû§¶Ô»°ÖÐÌáÈ¡¡¢ÕûºÏºÍ¼ìË÷Ö÷ÒªÐÅÏ¢¡£¡£
Mem0 ¹©Ó¦ÇáÁ¿¼¶µÄ»ØÒä²ã API ºÍÏòÁ¿¼ìË÷£¬£¬£¬¿ªÔ´²»µ½Ò»Ìì¾ÍÈ¡µÃÁË 9.7k stars£¬£¬£¬ÏÖÔÚÒÑÀÛ»ý 38.2k stars¡£¡£Netflix¡¢Lemonade ºÍ Rocket Money µÈ°²ÅÅÒÑÑ¡Óà Mem0 À´ÔöÇ¿Æä AI ϵͳµÄ³¤Ê±¿Ì»ØÒä²Å»ª¡£¡£
±ðµÄ£¬£¬£¬Òµ½ç»¹·ºÆðÁ˶àÖÖרÓù¤¾ß£¬£¬£¬½«¡°»ØÒ䡱×÷Ϊ¿É²å°ÎµÄЧÀÍ£¬£¬£¬ÎªÖÇÄÜÌ幩Ӧ´æ´¢Óë¼ìË÷ÐÅÏ¢µÄ²Å»ª£¬£¬£¬³£¼û²½·¥°üÀ¨ÔËÓÃ֪ʶͼÆ×»òÏòÁ¿Êý¾Ý¿âµÈÍýÏë¡£¡£
µ¥¶ÀÆÀ¼ÛÕâЩ»ØÒ乤¾ßµÄÓÐÓÃÐÔ¼«¶ËÄÑÌâ¡£¡£ÖÇÄÜÌåµÄ»ØÒäÖÊÁ¿ÍùÍù¸ü¶àÈ¡¾öÓڵײãÖÇÄÜÌåϵͳ°ìÀíÉÏÏÂÎĺÍŲÓù¤¾ßµÄ²Å»ª£¬£¬£¬¶ø²»ÊÇ»ØÒ乤¾ß×ÔÉí¡£¡£ÀýÈ磬£¬£¬×ÝȻһ¸ö²éÕÒ¹¤¾ßÀíÂÛÉϹ¦ÓøüÇ¿£¬£¬£¬µ«ÈôÊÇÖÇÄÜÌåÎÞ·¨ÓÐÓÃÔËÓÃËü£¬£¬£¬ÀýÈçÌáÐÑ´ÊÍýÏë²î»òѵÁ·Êý¾ÝÖжÌÉÙÏà¹ØÊ¾Àý£¬£¬£¬ËüÔÚ»ØÒ䳡¾°ÏµÄÌåÏÖÒ²²»»áºÃ¡£¡£
Òò¶ø£¬£¬£¬»ØÒ乤¾ßµÄÆÀ¼ÛÖ÷Òª»á¼¯ÔÚÀàËÆ LoCoMo ÕâÑùµÄ¼ìË÷»ù×¼¿¼ÊÔ£¬£¬£¬¶ø·ÇÕæÊµµÄÖÇÄÜÌ廨Òä²Å»ª¡£¡£
LoCoMo ÊÇÒ»¸ö´Ó³¤¶Ô»°ÖоÙÐмìË÷µÄÎÊ´ð»ù×¼£¬£¬£¬×¨ÃÅÓÃÓÚÆÀ¼Û´óÄ£×Ó³¤Ê±¿Ì¶Ô»°»ØÒä²Å»ª£¬£¬£¬ÓÉ Snap Research ÍŶÓÍÆ³ö¡£¡£Ã¿¸öÑù±¾°üÀ¨Á½ÃûÐéÄâÓïÑÔÕߺÍÒ»·Ý AI ÌìÉúµÄ´øÊ±¿Ì´ÁµÄ¶Ô»°¼Í¼£¬£¬£¬Ê¹ÃüÊǻظ´¹ØÓÚÓïÑÔÕß»ò¶Ô»°ÖзºÆðµÄÏÖʵÎÊÌâ¡£¡£
ÔÚ 4 ÔÂβµÄÂÛÎÄÖУ¬£¬£¬Mem0 ÍŶÓÔÚ֮ǰµÄ»ù´¡ÉÏÒý½øÁËÒÀ¾ÝͼµÄ»ØÒäÅú×¢£¬£¬£¬À´ÔöÇ¿ÁªÏµ½¨Ä£²Å»ª¡£¡£
֮ǰ£¬£¬£¬Mem0 µÄÌáÈ¡½×¶Î´¦Öóͷ£ÒôѶºÍǰʷÉÏÏÂÎÄÒÔ½¨ÉèÐµĻØÒ䣻£»£»£»¸üн׶ÎÔò½«ÌáÈ¡³öµÄ»ØÒäÓëÀàËÆµÄÏÖÓлØÒä¾ÙÐбȶԣ¬£¬£¬¾Óɹ¤¾ßŲÓûúÖÆÍÆÐÐÏìÓ¦²Ù×÷¡£¡£Êý¾Ý¿â×÷ΪÖÐÐÄ´æ´¢¿â£¬£¬£¬¹©Ó¦´¦Öóͷ£ËùÐèµÄÉÏÏÂÎÄ£¬£¬£¬²¢´æ´¢¸üкóµÄ»ØÒä¡£¡£
Òý½øÒÀ¾ÝͼµÄ»ØÒäºó£¬£¬£¬ÌáÈ¡½×¶ÎÔËÓôóÄ£×Ó½«¶Ô»°ÒôѶת»»ÎªÊµÌåºÍÁªÏµÈýÔª×飻£»£»£»¸üн׶ÎÔÚ½«ÐÂÐÅÏ¢ÕûºÏµ½ÒÑÓÐ֪ʶͼÆ×ʱ£¬£¬£¬Ñ¡Óõִ¥¼ì²âÓë´¦Öóͷ£»úÖÆ¡£¡£
ÔÚʵ¼ùÍê½áÖУ¬£¬£¬Mem0g ÔËÓà Neo4j ×÷Ϊµ×²ãͼÊý¾Ý¿â £¬£¬£¬ÒÀ¾Ý´óÄ£×ÓµÄÌáÈ¡Æ÷ºÍ¸üÐÂÄ£¿£¿£¿£¿£¿é²¢ÒÀ¸½¾ßÓк¯ÊýŲÓòŻªµÄ GPT-4o-mini£¬£¬£¬´Ó·Ç½á¹¹»¯Îı¾ÖоÙÐнṹ»¯ÐÅÏ¢ÌáÈ¡¡£¡£¾Óɽ«ÒÀ¾ÝͼµÄÅú×¢ÓëÓïÒåǶÈëÒÔ¼°ÒÀ¾Ý´óÄ£×ÓµÄÐÅÏ¢ÌáÈ¡ÏàÁ¬Ïµ£¬£¬£¬Mem0 È¡µÃÁËÔÓÂÒÍÆÀíËùÐèµÄ½á¹¹·á¸»ÐÔºÍ×ÔÈ»ÓïÑÔÏàʶËùÐèµÄÓïÒåѸËÙÐÔ¡£¡£
ÔÚ LOCOMO »ù×¼¿¼ÊÔÖУ¬£¬£¬Mem0 Åú×¢Æä¼ÌÐøÓâÔ½ÁùÖÖÕùÏȵĻØÒä²½·¥£¬£¬£¬ÌåÏÖΪ£ººôӦ׼ȷÂÊ±È OpenAI µÄÌá¸ß 26% ¡¢ÍƳٱÈÈ«ÉÏÏÂÎIJ½·¥Ï½µ 91%¡¢token ÔËÓÃÁ¿½ÚÔ¼ 90%¡£¡£
ÏÂͼÊDzî±ð»ØÒä²½·¥ÔÚ p50 ºÍ p95 µÄ×ܺôÓ¦ÍÆ³Ù½ÏÁ¿£¬£¬£¬Æä¼ä°üÀ¨ÁË´óÄ£×ÓÍÆÀíÔÚÄÚµÄÍÆ³Ù¡£¡£
Mem0 ÍŶÓÒÔΪ£¬£¬£¬ÔÚ AI ÖÇÄÜÌå°²ÅÅÖУ¬£¬£¬ÒÀ¾ÝÏêÏ¸ÍÆÀí³¡¾°Ñ¸ËÙµ÷½â»ØÒä½á¹¹ºÜÖ÷Òª£º
Mem0 µÄŨÃÜ»ØÒä¹ÜµÀר³¤¿ìËÙºôÓ¦¡¢¼òÂÔÅÌÎÊ£¬£¬£¬×î´ó¼«ÏÞÏ÷¼õ token ãýÃðÓëºËË㿪֧£»£»£»£»¶ø¸ÄÉÆºó£¬£¬£¬Mem0 µÄ½á¹¹»¯Í¼±íÕ÷ÄÜÃ÷ÎúÆÊÎöÔÓÂÒÁªÏµ£¬£¬£¬Ö§³ÖÔÓÂÒÊÂÇéÅÅÐòºÍ·á¸»ÉÏÏÂÎÄÕûºÏ£¬£¬£¬Ò»Æð²»Ï×Éíʵ¼ù¹¦ÂÊ¡£¡£Á½ÕßÐÁ¦¹¹½¨ÁËÒ»¸ö¶à¹¦ÓõĻØÒ乤¾ß°ü£¬£¬£¬Äܹ»Ï°¹ß¶àÑùµÄ¶Ô»°ÐèÇ󣬣¬£¬²¢¾ßÓдóÍýÏë°²ÅŲŻª¡£¡£
6 ÔÂʱ·Ö£¬£¬£¬Sarah ÔÚ GitHub ÉÏÎÊѯ Mem0 ÊÇÔõôȡµÃ MemGPT µÄÏà¹ØÊý¾ÝµÄ£¬£¬£¬µ«Ã»ÓлØÓ¦¡£¡£
¡°ÓÐÒ»¸ö»ØÒ乤¾ß³§ÉÌ Mem0 Ðû²¼ÁËÓÐÕùÒéµÄЧ¹û£¬£¬£¬Ðû³ÆÔÚ LoCoMo ÉÏÔËתÁË MemGPT¡£¡£µ«Ð§¹ûÁîÈËÒÉÐÄ£¬£¬£¬ÓÉÓÚÔÛÃÇ£¨MemGPT µÄÔÍŶӣ©ÎÞ·¨ÕÒµ½²»¾ÙÐдóÍýÏë´úÂëÖØ¹¹¾Í½« LoCoMo Êý¾Ý¹àÈë MemGPT/Letta µÄ²½·¥¡£¡£Mem0 ²¢Î´»ØÓ¦ÔÛÃÇ¶ÔÆä»ù×¼¿¼ÊÔºËËã²½·¥µÄŪÇåÆòÇ󣬣¬£¬尿看曰韩色情大片;流行色情ҲûÓй©Ó¦Ö§³Ö LoCoMo Êý¾Ý»ØÌîµÄÐÞÕý°æ MemGPT Íê½á¡£¡£¡±Letta Åú×¢¡£¡£
ÍâµØÊ±¿Ì 8 Ô 12 ÈÕ£¬£¬£¬Letta ·¢Îijƣ¬£¬£¬Letta ÔÚ LoCoMo ÉϽö¾Óɽ«¶Ô»°Ç°Ê·´æ´¢ÔÚÎļþÖУ¨¶ø²»ÊÇÔËÓÃרÃŵĻØÒä»ò¼ìË÷¹¤¾ß£©£¬£¬£¬¾ÍµÖ´ïÁË 74.0% µÄ׼ȷÂÊ¡£¡£ÕâÅú×¢£º
֮ǰµÄ»ØÒä»ù×¼¿¼ÊÔ»òÐí²¢²»Ê®·ÖÓмÄÒ壻£»£»£»
»ØÒä¸ü¶àÈ¡¾öÓÚÖÇÄÜÌåÔõô°ìÀíÉÏÏÂÎÄ£¬£¬£¬¶ø²»ÊÇËùÔËÓõÄÏêϸ¼ìË÷»úÖÆ¡£¡£
Letta Åú×¢£¬£¬£¬Ö»¹Ü Letta ×ÔÉíûÓÐÔÉú²½·¥µ¼Èë LoCoMo ÄÇÑùµÄ¶Ô»°Ç°Ê·£¬£¬£¬µ«Æä×î½üΪ Letta ÖÇÄÜÌ壨°üÀ¨ MemGPT ÖÇÄÜÌ壩ÔöÌíÁËÎļþϵͳ¹¦Óᣡ£¡°ÔÛÃÇÁÔÆæ£¬£¬£¬ÈôÊǽö½ö°Ñ LoCoMo µÄ¶Ô»°Ç°Ê··Å½øÒ»¸öÎļþ£¬£¬£¬¶ø²»ÔËÓÃÈκÎרÓûØÒ乤¾ß£¬£¬£¬Letta µÄÌåÏÖ»áÔõô¡£¡£¡±
µ±Îļþ±»¹ÒÔØµ½ Letta ÖÇÄÜÌåºó£¬£¬£¬ÖÇÄÜÌåÄܹ»ÔËÓÃÒÔÏÂÎļþ²Ù×÷¹¤¾ß£º
¶Ô»°Êý¾Ý±»·Å½øÒ»¸öÎļþ²¢ÉÏ´«¹ÒÔØµ½ÖÇÄÜÌåÖС£¡£Letta »á×Ô¶¯ÆÊÎö²¢Ç¶ÈëÎļþÄÚÈÝ£¬£¬£¬ÒÔ±ã¾ÙÐÐÓïÒ壨ÏòÁ¿£©²éÕÒ¡£¡£ÖÇÄÜÌåÄܹ»Óà search_files ×öÓïÒå²éÕÒ£¬£¬£¬Óà grep ¾ÙÐÐÎı¾Æ¥Å䣬£¬£¬ÔÙÓà answer_question »Ø¸´ÎÊÌâ¡£¡£
ΪÁËÓë MemGPT µÄÔÊÔÑé¼á³ÖÒ»Ö£¬£¬£¬Letta Óà GPT-4o mini ×÷Ϊģ×Ó¡£¡£ÓÉÓÚ GPT-4o mini ²Å»ª½ÏÈõ£¬£¬£¬Letta ÈÃÖÇÄÜÌ岿·Ö×ÔÖΣ¬£¬£¬¾ÓɹæÔòÔ¼ÊøÆäŲÓù¤¾ßµÄÐÎʽ£º±ØÐèÏÈŲÓà search_files ²éÕÒÎļþ£¬£¬£¬ÔÙÒ»Ö±²éÕÒÖ±µ½¾öÒéŲÓà answer_question ²¢Íê±Ï¡£¡£²éÕÒʲô¡¢²éÕÒ¼¸¶à´ÎÓÉÖÇÄÜÌå×ÔÐоöÒé¡£¡£
¡°Õâ¸ö¼òÂÔµÄÖÇÄÜÌåÔÚ GPT-4o mini ºÍ×îÉÙÌáÐѵ÷ÓŵÄÇéÐÎÏ£¬£¬£¬¾ÍÔÚ LoCoMo ÉÏÈ¡µÃÁË 74.0% µÄЧ¹û£¬£¬£¬ÏÔןßÓÚ Mem0 ³ÂÊöµÄÆä×î¼Ñͼ»ØÒä°æ±ðµÄ 68.5%¡£¡£¡±
Letta ÒÔΪ£¬£¬£¬ÏÖÔÚµÄÖÇÄÜÌåÔÚÔËÓù¤¾ß·½ÃæÊ®·Ö¸ßЧ£¬£¬£¬ÓÈÆäÊÇÄÇЩºÜ»òÐí·ºÆðÔÚѵÁ·Êý¾ÝÖеŤ¾ß£¬£¬£¬ÈçÎļþϵͳ²Ù×÷¡£¡£Òò¶ø£¬£¬£¬Ðí¶àÔÀ´Îªµ¥Ìø¼ìË÷ÍýÏëµÄרÓûØÒ乤¾ß£¬£¬£¬»¹²»ÈçÖ±½ÓÈÃÖÇÄÜÌå×ÔÖ÷µü´ú²éÕÒÊý¾ÝÀ´µÃÓÐÓᣡ£
ÖÇÄÜÌåÄܹ»ÌìÉú×Ô¼ºµÄ²éÕÒÅÌÎÊ£¬£¬£¬¶ø²»µ«½öÊǼìË÷ÔʼÎÊÌ⣬£¬£¬ÀýÈ罫 ¡°How does Calvin stay motivated when faced with setbacks?¡± ת»¯Îª ¡°Calvin motivation setbacks¡±£¬£¬£¬²¢ÇÒÖÇÄÜÌåÄܹ»¼ÌÐø²éÕÒÖ±µ½ÕÒµ½×¼È·Êý¾Ý¡£¡£
ÖÇÄÜÌåÊÇ·ñ¡°¼Ç×Å¡±ÁËijÊ£¬£¬£¬È¡¾öÓÚËüÄÜ·ñÔÚÐèÇóʱÀֳɼìË÷µ½×¼È·ÐÅÏ¢¡£¡£Òò¶ø£¬£¬£¬¸üÖ÷ÒªµÄÊÇ˼Á¿ÖÇÄÜÌåÊÇ·ñÄܹ»ÓÐÓÃÔËÓüìË÷¹¤¾ß£¨ÖªµÀºÎʱÒÔ¼°ÔõôŲÓã©£¬£¬£¬¶ø²»ÊǾÀ½áÓÚÏêϸµÄ¼ìË÷»úÖÆ£¨Èç֪ʶͼÆ×ÈÔÊÇÏòÁ¿Êý¾Ý¿â£©¡£¡£
Letta »¹Ìá³ö£¬£¬£¬ÏÖÔÚÖÇÄÜÌåÄܹ»Ê®·Ö¸ßЧµØÔËÓÃÎļþϵͳ¹¤¾ß£¬£¬£¬ÔںܺéÁ÷ƽÉÏÊÇÓÉÓÚºóÆÚÓÅ»¯ÒªµãÇãÏòÖÇÄÜÌåµÄ±àÂëʹÃü¡£¡£Ò»Ñùƽ³£À´Ëµ£¬£¬£¬Ô½¼òÂԵŤ¾ßÔ½»òÐí·ºÆðÔÚÖÇÄÜÌåµÄѵÁ·Êý¾ÝÖУ¬£¬£¬Ò²Ô½¼òÂÔ±»ÓÐÓÃÔËÓᣡ£Ö»¹Ü¸üÔÓÂÒµÄÍýÏ루Èç֪ʶͼÆ×£©ÔÚÌØ¶¨ÁìÓò»òÐíÓÐÓ㬣¬£¬µ«ËüÃÇ»òÐí¸üÄѱ» ´óÄ£×Ó£¨ÖÇÄÜÌ壩Ïàʶ¡£¡£
¡°ÖÇÄÜÌåµÄ»ØÒä²Å»ªÈ¡¾öÓÚÖÇÄÜÌåµÄ¼Ü¹¹¡¢¹¤¾ßºÍµ×²ãÄ£×Ó¡£¡£½ÏÁ¿ÖÇÄÜÌå½á¹¹Óë»ØÒ乤¾ß£¬£¬£¬¾ÍÏñ½ÏÁ¿Æ»¹ûºÍéÙ×Ó£¬£¬£¬ÓÉÓڽṹ¡¢¹¤¾ßºÍÄ£×Ó¶¼ÊÇÄܹ»×ÔÓÉ×éºÏµÄ¡£¡£¡±Letta ˵µÀ¡£¡£
ÄÇÔõô׼ȷÆÀ¼ÛÖÇÄÜÌ廨Òä²Å»ªÄØ£¿£¿£¿£¿£¿
Letta ÏÈÒý¼öÁË×Ô¼ÒµÄ Letta Memory Benchmark£¨Letta ÅÅÐаñ£© ¹©Ó¦ÁËͬÀà±ÈÕÕ£¨apples-to-apples£©£¬£¬£¬ÔÚ¼á³Ö½á¹¹£¨ÏÖÔÚ½ö Letta£©ºÍ¹¤¾ßÎȹ̵ÄÇéÐÎÏ£¬£¬£¬ÆÀ¼Û²î±ðÄ£×ÓÔÚ»ØÒä°ìÀí·½ÃæµÄ²Å»ª¡£¡£¸Ã»ù×¼ÔÚ¶¯Ì¬ÉÏÏÂÎÄÖм´Ê±ÌìÉú»ØÒä½»»¥³¡¾°£¬£¬£¬È»ºóÆÀ¼ÛÖÇÄÜÌ廨Ò䣬£¬£¬¶ø²»µ«½öÊǼìË÷²Å»ª£¨Èç LoCoMo£©¡£¡£
È»ºóÖ¸³ö£¬£¬£¬ÁíÒ»ÖÖ²½·¥ÊÇÖ±½ÓÆÀ¼ÛÖÇÄÜÌåÔÚÐèÇó»ØÒäµÄÏêϸʹÖÀÖеÄÈ«ÌåÌåÏÖ¡£¡£ÀýÈç Terminal-Bench£¬£¬£¬¿¼ÊÔÖÇÄÜÌå´¦Öóͷ£ÔÓÂÒ¡¢³¤Ê±¿ÌÔËתʹÃüµÄ²Å»ª¡£¡£ÓÉÓÚʹÃüʱ¿Ì³¤ÇÒÐèÇó´¦Öóͷ£Ô¶³¬ÉÏÏÂÎÄ´°¿ÚµÄÐÅÏ¢£¬£¬£¬ÖÇÄÜÌåÄܹ»ÔËÓûØÒä¶¢ÉÒʹÃü״̬ÓëÏ£Íû¡£¡£
×îÖÕ£¬£¬£¬Letta ×ܽáµÀ£¬£¬£¬¹ØÓÚÍýÏëÓÅÒìµÄÖÇÄÜÌ壬£¬£¬×ÝÈ»ÊǼòÂÔµÄÎļþϵͳ¹¤¾ß£¬£¬£¬Ò²×ãÒÔÔÚ LoCoMo ÕâÑùµÄ¼ìË÷»ù×¼ÖÐÌåÏÖÓÅÒì¡£¡£
²ÎÔÄÁ´½Ó£º
https://x.com/sarahwooders/status/1955352237490008570?s=46
https://www.letta.com/blog/benchmarking-ai-agent-memory
±¾ÎÄÀ´×Ô΢ÐŹ«¹²ºÅ¡°InfoQ¡±£¬£¬£¬×÷ÕߣºñÒÐÓ¾ê £¬£¬£¬36ë´¾ÊÚȨÐû²¼¡£¡£