ÄúÏÖÔÚµÄλÖãºÊ×Ò³
¡°ÎÒÕæµÄÑá¶ñÁË¿´µ½ÄÇЩ¼±ÓÚÇó³ÉµÄ¿Æ¼¼Ê×´´¹«Ë¾£¬£¬ÎªÁËͶºÏ·çͶ¶øÔÚÊý¾ÝÉÏ˵»Ñ£¬£¬»¹ÌùÉÏ¡®SOTA¡¯µÄ±êÇ©¡£¡£¡£¡±ÓÐÍøÓÑͲۡ£¡£¡£
ÊÂÇéÔ´ÓÚ¸ßÈËÆø¿ªÔ´ÖÇÄÜÌ廨ÒäÏîÄ¿ Mem0 ÔÚ½ñÄê 4 ÔÂβÐû²¼µÄһƪÂÛÎÄ¡£¡£¡£ÂÛÎÄÖУ¬£¬¸ÃÏîÄ¿ÍŶÓΪ¿ÉÀ©Õ¹µÄ¡¢ÒÔ»ØÒäΪÖÐÐĵļܹ¹ Mem0 Ìá³öÁËÔöÇ¿°æ±ð£¬£¬²¢Ðû³ÆÔÚ LOCOMO ÉÏ»÷°ÜÁËËùÓÐÈË£¬£¬Æä¼ä£¬£¬Mem0 ÔÚ ¡°LLM-as-a-Judge¡± Ä¿µÄÉÏÏà½ÏÓÚ OpenAI Ìá¸ßÁË 26%¡£¡£¡££¨ÂÛÎĵص㣺https://arxiv.org/abs/2504.19413£©
ÍâµØÊ±¿Ì 8 Ô 13 ÈÕ£¬£¬ ÁíÒ»¸ö¸ßÈËÆøµÄÖÇÄÜÌ廨Òä½á¹¹ MemGPT µÄ¿ª´´ÍÅ¶Ó Letta AI £¬£¬ÆäÁªºÏ¿ª´´È˼æ CTO Sarah Wooders ¶Ô´Ë½ÒÆÆÖ¸¿Ø£º
¼¸¸öÔÂǰ£¬£¬Mem0 Ðû²¼ÁË MemGPT µÄ»ù×¼¿¼ÊÔÊý¾Ý£¬£¬²¢Ðû³ÆÔÚ»ØÒä·½ÃæµÖ´ïÁË ¡°SOTA¡± ˮƽ¡£¡£¡£
Ï£ÆæµÄÊÇ£¬£¬ÎÒ³¹µ×²»ÖªµÀËûÃǾ¿¾¹ÊÇÔõÑùÅÜÕâ¸ö»ù×¼¿¼ÊԵ쬣¬ÈôÊÇ²î³Ø MemGPT ×öÑÏÖØÐÞÕý£¬£¬Õâ¸ö¿¼ÊÔ»ù´¡ÎÞ·¨Íê½á£¨ËûÃÇûÓлØÓ¦ÔÛÃǹØÓÚÊÔÑéÏêϸÔËת²½·¥µÄÎÊѯ£©¡£¡£¡£
arXiv ²¢²»ÊǾÓÉÙÉÐÐÆÀ¶¨µÄÇþµÀ£¬£¬ÒÔÊDz»ÐÒµÄÊÇ£¬£¬½üÄêÀ´¹«Ë¾Äܹ»ËæÒâÐû²¼ÈκÎËûÃÇÏëÒªµÄ¡°×êÑС±Ð§¹ûÀ´×öÊг¡ÓªÏú¡£¡£¡£
ÔÛÃǺÜÇáËɾÍÓÃһЩ¼òÂÔµÄÎļþϵͳ¹¤¾ßÓâÔ½ÁËËûÃǵĻù×¼Êý¾Ý¡ª¡ªÕâÒ²ÆÊÎöÕâ¸ö»ù×¼¿¼ÊÔ×ÔÉí²¢Ã»ÓÐÌ«´ó¼ÄÒå¡£¡£¡£
¡°Mem0 Ðû³ÆËûÃÇÔÚ LOCOMO ÉÏ»÷°ÜÁËËùÓÐÈË£¬£¬µ«Ð§¹û·¢Ã÷ËûÃdz¹µ×°Ñ¾ºÕùµÐÊÖµÄÍê½á¸ãÔÒÁË¡£¡£¡£È»ºó»¹ÓÃÕâЩÔã¸âµÄЧ¹ûÀ´Ö¤Êµ×Ô¼ºµÄÓÅÊÆ¡£¡£¡£±È¼° Letta ºÍ Zep °´×¼È·²½·¥ÅÜÁË»ù×¼¿¼ÊԺ󣬣¬Á½Õߵĵ÷ֶ¼±È Mem0 µÄ×î¼ÑЧ¹ûºá¿ç 10%¡£¡£¡£¡±ÍøÓѵãÆÀµÀ£¬£¬¡°Õâ¸öÖ°ÒµÀïµÄ¡®¿ÕÆø²úÆ·¡¯¶àµ½ÀëÆ×¡£¡£¡£ÎÒÏàʶΪÁËÄõ½·çͶ£¬£¬ÆóÒµ»á¿äÕŹ¦Ó㬣¬µ«ÔÚ¿ÆÑÐÂÛÎÄÀï˵»Ñ×ÅʵÊǿɱ¯¡£¡£¡£¡±
Mem0 ºÍ Letta µÄ½µÉú¶¼ÊÇΪÁË´¦Öóͷ£´óÄ£×ӵij¤Ê±¿Ì»ØÒäÎÊÌâ¡£¡£¡£
×Ô GPT-4 ÃæÊÀÒÔÀ´£¬£¬´óÄ£×ÓÒ»Ö±ÊÜÏÞÓÚÀο¿µÄÉÏÏÂÎij¤¶È¡£¡£¡£Ã»Óг¤Ê±¿Ì»ØÒ䣬£¬´óÄ£×ÓºÍÖÇÄÜÁìÅöÃæÁÙÏÔ×ÅÔ¼Êø£ºËüÃÇ»áÒÅÍüÐÅÏ¢£¬£¬ÎÞ·¨Ëæ×Åʱ¿ÌѧϰºÍ¸ÄÉÆ£¬£¬²¢ÇÒÔÚ³¤Ê±¿Ì¡¢ÔÓÂÒµÄʹÖÀÖлáʧµôÄ¿µÄ¡£¡£¡£
Ϊ´Ë£¬£¬ÔÚ 2023 Ä꣬£¬¼ÓÖÝ´óѧ²®¿ËÀû·ÖУ£¨UC Berkeley£©µÄ×êÑÐÍŶÓÌá³öµÄÒ»ÖÖÁ¢Òìʽϵͳ MemGPT£¬£¬ ѧϰ¹Å°å²Ù×÷ϵͳ£¨OS£©µÄÀíÄ£¬Òý½øÁËÖÇÄÜÌåµÄ»ØÒä°ìÀí£¬£¬¾Óɹ¹½¨»ØÒä²ã¼¶£¬£¬ÈÃÖÇÄÜÌå×Ô¶¯°ìÀíÄÄЩÐÅÏ¢±£±£´æ¼´Ê±ÉÏÏÂÎÄ£¨ÖÐÐÄ»ØÒ䣩ÖС¢ÄÄЩ´æ´¢ÔÚÍⲿ²ã£¨¶Ô»°»ØÒä¡¢¹éµµ»ØÒäºÍÍⲿÎļþ£©£¬£¬ÒԱ㰴Ðè¼ìË÷¡£¡£¡£ÕâÑù£¬£¬ÖÇÄÜÌåÄܹ»ÔÚÀο¿µÄÉÏÏÂÎÄ´°¿ÚÄÚ¼á³ÖÎÞÏ޵ĻØÒäÈÝÁ¿¡£¡£¡£
MemGPT µÄ×êÑÐѸËÙÒýÆðÉçÇøÖØÊÓ£¬£¬MemGPT ÂÛÎĵÄÌû×ÓÔÚ Hacker News Ö÷Ò³ÉÏÍ£ÁôÁË 48 Сʱ£¬£¬¿ªÔ´ºóÒÑÀÛ»ý 17.8k stars¡£¡£¡£
Ëæ×Å¿ªÔ´ÏîÄ¿µÄÍÆ½ø£¬£¬ÍŶӽ¨ÉèÁËÃûΪ Letta µÄ¹«Ë¾£¬£¬¼ÌÐø±£»£»£»£»£»¤ MemGPT ¿ªÔ´½á¹¹£¬£¬²¢ÍƽøÆäÉÌÒµ»¯ºÍ¹¤³Ì»¯Â䵨¡£¡£¡£ÔÀ´µÄ MemGPT Ò²½ú¼¶³ÉÁË Letta¡£¡£¡£
Õâ¼ÒÓɲ®¿ËÀû²©Ê¿Éú Sarah Wooders ºÍ Charles Packer ½¨ÉèµÄ AI Ê×´´¹«Ë¾±¸ÊÜÆÚ´ý¡£¡£¡£Letta È¡µÃÁËÓÉ Felicis µÄ Astasia Myers ÁìͶµÄ 1000 ÍòÃÀÔªÖÖ×Ó×ʽ𣬣¬±¾ÂÖ¹ÀֵΪ 7000 ÍòÃÀÔª¡£¡£¡£±ðµÄ£¬£¬»¹»ñµÃÁËÈ˹¤ÖÇÄÜÁìÓòһϵÁÐÌìʹͶ×ÊÈ˵ÄÖ§³Ö£¬£¬Æä¼ä°üÀ¨¹È¸èµÄ Jeff Dean¡¢Hugging Face µÄ Clem Delangue¡¢Runway µÄ Crist¨®bal Valenzuela ºÍ Anyscale µÄ Robert Nishihara µÈ¡£¡£¡£
ÏÖÔÚ£¬£¬Ðí¶àÖÇÄÜÌåϵͳ¶¼Íê½áÁË MemGPT µÄÍýÏë¡£¡£¡£
Mem0 ÔòÊÇÓÉÓ¡¶È¹¤³Ìʦ Taranjeet Singh ºÍ Deshraj Yadav ½¨É裬£¬Ô´ÓÚËûÃǹ¹½¨¿ªÔ´¼ìË÷ÔöÇ¿ÌìÉú (RAG) ½á¹¹ Embedchain µÄÂÄÀú£¬£¬¸Ã½á¹¹ÏÂÔØÁ¿ÓâÔ½ 200 Íò´Î¡£¡£¡£
ÒÀ¾Ý YC µÄ½éÉÜ£¬£¬Singh Ôø×÷ΪÊ×λÔöÌí¹¤³Ìʦ¼ÓÈë Khatabook£¨YC S18£©£¬£¬²¢Ñ¸ËÙÌáÉýΪ¸ßµÈ²úƷ˾Àí¡£¡£¡£ËûµÄÈí¼þ¹¤³ÌÖ°ÒµÉúÑÄʼÓÚ Paytm£¨Ó¡¶ÈµÄ PayPal£©£¬£¬Ç×ÀúÁËÆäѸËÙÐËÆð³ÉΪÖÚËùÖÜÖªµÄÆ·ÅÆ¡£¡£¡£Ëû¿ª·¢ÁËÒ»¿îÓÉ AI Çý¶¯µÄ½ÌÓýÔËÓ㬣¬ÔøÔÚ Google I/O É϶Á³¡£¡£¡£ËûÓë Deshraj Ò»Æð½¨ÉèÁË EvalAI£¬£¬ÕâÊÇÒ»¸ö¿ªÔ´µÄ Kaggle È¡´úÇþµÀ£¬£¬GitHub ÉÏÈ¡µÃÁË 1.6K stars¡£¡£¡£Ëû»¹½¨ÉèÁËÊ׸ö GPT ÔËÓÃÉÌÆÌ£¬£¬Óû§ÍýÏëÍ»ÆÆ 100 Íò¡£¡£¡£
Yadav ÔòÆÕ±éÖØÊÓÈ˹¤ÖÇÄܺͻúеѧϰ»ù´¡ÉèÊ©ÁìÓò£¬£¬ÔøÏòµ¼ÌØË¹澳门在线荷ê男人在线亚洲资源站48;欧美亚洲À×Ô¶¯¼ÝÔ¦µÄ AI ÇþµÀ£¬£¬Ö§³ÖÌØË¹ÀÈ«×Ô¶¯¼ÝÔ¦¿ª·¢ÖеĴóÍýÏëѵÁ·¡¢Ä£×ÓÆÀ¼Û¡¢¼à¿ØºÍ¿ÉÊÓ²ìÐÔ¡£¡£¡£ÔÚ´Ë֮ǰ£¬£¬Deshraj ÔÚÇÇÖÎÑÇÀí¹¤Ñ§ÔºÍê½á˶ʿÂÛÎÄʱ½¨ÉèÁË¿ªÔ´»úеѧϰÇþµÀ EvalAI£¬£¬²¢ÔÚ CVPR¡¢ECCV¡¢AAAI µÈÉÏÐû²¼¹ýÂÛÎÄ¡£¡£¡£
Mem0 ÒÔΪ£¬£¬´¿´âµØÀ©Õ¹Ä£×ÓµÄÉÏÏÂÎÄ´°¿ÚÖ»»áÍÆ³ÙÎÊÌâµÄ±¬·¢£¬£¬Ä£×Ó»á±äµÃ¸üÂý¡¢×ÊÔ´¸ü¸ß£¬£¬²¢ÇÒÈÔÈ»»áÊèºöÒªº¦Ï¸½Ú¡£¡£¡£ÍŶÓÌôÑ¡¾ÓÉÒ»¸öͨÓᢿÉÀ©Õ¹µÄ»ØÒä¼Ü¹¹À´´¦Öóͷ£ÎÊÌ⣬£¬Mem0 ³äµ±ÁË AI ÔËÓóÌÐòºÍ´óÄ£×ÓÖ®¼äµÄ»ØÒä²ã£¬£¬Äܹ»¶¯Ì¬µØ´ÓÓû§¶Ô»°ÖÐÌáÈ¡¡¢ÕûºÏºÍ¼ìË÷Ö÷ÒªÐÅÏ¢¡£¡£¡£
Mem0 ¹©Ó¦ÇáÁ¿¼¶µÄ»ØÒä²ã API ºÍÏòÁ¿¼ìË÷£¬£¬¿ªÔ´²»µ½Ò»Ìì¾ÍÈ¡µÃÁË 9.7k stars£¬£¬ÏÖÔÚÒÑÀÛ»ý 38.2k stars¡£¡£¡£Netflix¡¢Lemonade ºÍ Rocket Money µÈ°²ÅÅÒÑÑ¡Óà Mem0 À´ÔöÇ¿Æä AI ϵͳµÄ³¤Ê±¿Ì»ØÒä²Å»ª¡£¡£¡£
±ðµÄ£¬£¬Òµ½ç»¹·ºÆðÁ˶àÖÖרÓù¤¾ß£¬£¬½«¡°»ØÒ䡱×÷Ϊ¿É²å°ÎµÄЧÀÍ£¬£¬ÎªÖÇÄÜÌ幩Ӧ´æ´¢Óë¼ìË÷ÐÅÏ¢µÄ²Å»ª£¬£¬³£¼û²½·¥°üÀ¨ÔËÓÃ֪ʶͼÆ×»òÏòÁ¿Êý¾Ý¿âµÈÍýÏë¡£¡£¡£
µ¥¶ÀÆÀ¼ÛÕâЩ»ØÒ乤¾ßµÄÓÐÓÃÐÔ¼«¶ËÄÑÌâ¡£¡£¡£ÖÇÄÜÌåµÄ»ØÒäÖÊÁ¿ÍùÍù¸ü¶àÈ¡¾öÓڵײãÖÇÄÜÌåϵͳ°ìÀíÉÏÏÂÎĺÍŲÓù¤¾ßµÄ²Å»ª£¬£¬¶ø²»ÊÇ»ØÒ乤¾ß×ÔÉí¡£¡£¡£ÀýÈ磬£¬×ÝȻһ¸ö²éÕÒ¹¤¾ßÀíÂÛÉϹ¦ÓøüÇ¿£¬£¬µ«ÈôÊÇÖÇÄÜÌåÎÞ·¨ÓÐÓÃÔËÓÃËü£¬£¬ÀýÈçÌáÐÑ´ÊÍýÏë²î»òѵÁ·Êý¾ÝÖжÌÉÙÏà¹ØÊ¾Àý£¬£¬ËüÔÚ»ØÒ䳡¾°ÏµÄÌåÏÖÒ²²»»áºÃ¡£¡£¡£
Òò¶ø£¬£¬»ØÒ乤¾ßµÄÆÀ¼ÛÖ÷Òª»á¼¯ÔÚÀàËÆ LoCoMo ÕâÑùµÄ¼ìË÷»ù×¼¿¼ÊÔ£¬£¬¶ø·ÇÕæÊµµÄÖÇÄÜÌ廨Òä²Å»ª¡£¡£¡£
LoCoMo ÊÇÒ»¸ö´Ó³¤¶Ô»°ÖоÙÐмìË÷µÄÎÊ´ð»ù×¼£¬£¬×¨ÃÅÓÃÓÚÆÀ¼Û´óÄ£×Ó³¤Ê±¿Ì¶Ô»°»ØÒä²Å»ª£¬£¬ÓÉ Snap Research ÍŶÓÍÆ³ö¡£¡£¡£Ã¿¸öÑù±¾°üÀ¨Á½ÃûÐéÄâÓïÑÔÕߺÍÒ»·Ý AI ÌìÉúµÄ´øÊ±¿Ì´ÁµÄ¶Ô»°¼Í¼£¬£¬Ê¹ÃüÊǻظ´¹ØÓÚÓïÑÔÕß»ò¶Ô»°ÖзºÆðµÄÏÖʵÎÊÌâ¡£¡£¡£
ÔÚ 4 ÔÂβµÄÂÛÎÄÖУ¬£¬Mem0 ÍŶÓÔÚ֮ǰµÄ»ù´¡ÉÏÒý½øÁËÒÀ¾ÝͼµÄ»ØÒäÅú×¢£¬£¬À´ÔöÇ¿ÁªÏµ½¨Ä£²Å»ª¡£¡£¡£
֮ǰ£¬£¬Mem0 µÄÌáÈ¡½×¶Î´¦Öóͷ£ÒôѶºÍǰʷÉÏÏÂÎÄÒÔ½¨ÉèÐµĻØÒ䣻£»£»£»£»¸üн׶ÎÔò½«ÌáÈ¡³öµÄ»ØÒäÓëÀàËÆµÄÏÖÓлØÒä¾ÙÐбȶԣ¬£¬¾Óɹ¤¾ßŲÓûúÖÆÍÆÐÐÏìÓ¦²Ù×÷¡£¡£¡£Êý¾Ý¿â×÷ΪÖÐÐÄ´æ´¢¿â£¬£¬¹©Ó¦´¦Öóͷ£ËùÐèµÄÉÏÏÂÎÄ£¬£¬²¢´æ´¢¸üкóµÄ»ØÒä¡£¡£¡£
Òý½øÒÀ¾ÝͼµÄ»ØÒäºó£¬£¬ÌáÈ¡½×¶ÎÔËÓôóÄ£×Ó½«¶Ô»°ÒôѶת»»ÎªÊµÌåºÍÁªÏµÈýÔª×飻£»£»£»£»¸üн׶ÎÔÚ½«ÐÂÐÅÏ¢ÕûºÏµ½ÒÑÓÐ֪ʶͼÆ×ʱ£¬£¬Ñ¡Óõִ¥¼ì²âÓë´¦Öóͷ£»úÖÆ¡£¡£¡£
ÔÚʵ¼ùÍê½áÖУ¬£¬Mem0g ÔËÓà Neo4j ×÷Ϊµ×²ãͼÊý¾Ý¿â £¬£¬ÒÀ¾Ý´óÄ£×ÓµÄÌáÈ¡Æ÷ºÍ¸üÐÂÄ£¿£¿é²¢ÒÀ¸½¾ßÓк¯ÊýŲÓòŻªµÄ GPT-4o-mini£¬£¬´Ó·Ç½á¹¹»¯Îı¾ÖоÙÐнṹ»¯ÐÅÏ¢ÌáÈ¡¡£¡£¡£¾Óɽ«ÒÀ¾ÝͼµÄÅú×¢ÓëÓïÒåǶÈëÒÔ¼°ÒÀ¾Ý´óÄ£×ÓµÄÐÅÏ¢ÌáÈ¡ÏàÁ¬Ïµ£¬£¬Mem0 È¡µÃÁËÔÓÂÒÍÆÀíËùÐèµÄ½á¹¹·á¸»ÐÔºÍ×ÔÈ»ÓïÑÔÏàʶËùÐèµÄÓïÒåѸËÙÐÔ¡£¡£¡£
ÔÚ LOCOMO »ù×¼¿¼ÊÔÖУ¬£¬Mem0 Åú×¢Æä¼ÌÐøÓâÔ½ÁùÖÖÕùÏȵĻØÒä²½·¥£¬£¬ÌåÏÖΪ£ººôӦ׼ȷÂÊ±È OpenAI µÄÌá¸ß 26% ¡¢ÍƳٱÈÈ«ÉÏÏÂÎIJ½·¥Ï½µ 91%¡¢token ÔËÓÃÁ¿½ÚÔ¼ 90%¡£¡£¡£
ÏÂͼÊDzî±ð»ØÒä²½·¥ÔÚ p50 ºÍ p95 µÄ×ܺôÓ¦ÍÆ³Ù½ÏÁ¿£¬£¬Æä¼ä°üÀ¨ÁË´óÄ£×ÓÍÆÀíÔÚÄÚµÄÍÆ³Ù¡£¡£¡£
Mem0 ÍŶÓÒÔΪ£¬£¬ÔÚ AI ÖÇÄÜÌå°²ÅÅÖУ¬£¬ÒÀ¾ÝÏêÏ¸ÍÆÀí³¡¾°Ñ¸ËÙµ÷½â»ØÒä½á¹¹ºÜÖ÷Òª£º
Mem0 µÄŨÃÜ»ØÒä¹ÜµÀר³¤¿ìËÙºôÓ¦¡¢¼òÂÔÅÌÎÊ£¬£¬×î´ó¼«ÏÞÏ÷¼õ token ãýÃðÓëºËË㿪֧£»£»£»£»£»¶ø¸ÄÉÆºó£¬£¬Mem0 µÄ½á¹¹»¯Í¼±íÕ÷ÄÜÃ÷ÎúÆÊÎöÔÓÂÒÁªÏµ£¬£¬Ö§³ÖÔÓÂÒÊÂÇéÅÅÐòºÍ·á¸»ÉÏÏÂÎÄÕûºÏ£¬£¬Ò»Æð²»Ï×Éíʵ¼ù¹¦ÂÊ¡£¡£¡£Á½ÕßÐÁ¦¹¹½¨ÁËÒ»¸ö¶à¹¦ÓõĻØÒ乤¾ß°ü£¬£¬Äܹ»Ï°¹ß¶àÑùµÄ¶Ô»°ÐèÇ󣬣¬²¢¾ßÓдóÍýÏë°²ÅŲŻª¡£¡£¡£
6 ÔÂʱ·Ö£¬£¬Sarah ÔÚ GitHub ÉÏÎÊѯ Mem0 ÊÇÔõôȡµÃ MemGPT µÄÏà¹ØÊý¾ÝµÄ£¬£¬µ«Ã»ÓлØÓ¦¡£¡£¡£
¡°ÓÐÒ»¸ö»ØÒ乤¾ß³§ÉÌ Mem0 Ðû²¼ÁËÓÐÕùÒéµÄЧ¹û£¬£¬Ðû³ÆÔÚ LoCoMo ÉÏÔËתÁË MemGPT¡£¡£¡£µ«Ð§¹ûÁîÈËÒÉÐÄ£¬£¬ÓÉÓÚÔÛÃÇ£¨MemGPT µÄÔÍŶӣ©ÎÞ·¨ÕÒµ½²»¾ÙÐдóÍýÏë´úÂëÖØ¹¹¾Í½« LoCoMo Êý¾Ý¹àÈë MemGPT/Letta µÄ²½·¥¡£¡£¡£Mem0 ²¢Î´»ØÓ¦ÔÛÃÇ¶ÔÆä»ù男人在线亚洲资源站trong>澳门在线荷官欧美亚洲×¼¿¼ÊÔºËËã²½·¥µÄŪÇåÆòÇ󣬣¬Ò²Ã»Óй©Ó¦Ö§³Ö LoCoMo Êý¾Ý»ØÌîµÄÐÞÕý°æ MemGPT Íê½á¡£¡£¡£¡±Letta Åú×¢¡£¡£¡£
ÍâµØÊ±¿Ì 8 Ô 12 ÈÕ£¬£¬Letta ·¢Îijƣ¬£¬Letta ÔÚ LoCoMo ÉϽö¾Óɽ«¶Ô»°Ç°Ê·´æ´¢ÔÚÎļþÖУ¨¶ø²»ÊÇÔËÓÃרÃŵĻØÒä»ò¼ìË÷¹¤¾ß£©£¬£¬¾ÍµÖ´ïÁË 74.0% µÄ׼ȷÂÊ¡£¡£¡£ÕâÅú×¢£º
֮ǰµÄ»ØÒä»ù×¼¿¼ÊÔ»òÐí²¢²»Ê®·ÖÓмÄÒ壻£»£»£»£»
»ØÒä¸ü¶àÈ¡¾öÓÚÖÇÄÜÌåÔõô°ìÀíÉÏÏÂÎÄ£¬£¬¶ø²»ÊÇËùÔËÓõÄÏêϸ¼ìË÷»úÖÆ¡£¡£¡£
Letta Åú×¢£¬£¬Ö»¹Ü Letta ×ÔÉíûÓÐÔÉú²½·¥µ¼Èë LoCoMo ÄÇÑùµÄ¶Ô»°Ç°Ê·£¬£¬µ«Æä×î½üΪ Letta ÖÇÄÜÌ壨°üÀ¨ MemGPT ÖÇÄÜÌ壩ÔöÌíÁËÎļþϵͳ¹¦Óᣡ£¡£¡°ÔÛÃÇÁÔÆæ£¬£¬ÈôÊǽö½ö°Ñ LoCoMo µÄ¶Ô»°Ç°Ê··Å½øÒ»¸öÎļþ£¬£¬¶ø²»ÔËÓÃÈκÎרÓûØÒ乤¾ß£¬£¬Letta µÄÌåÏÖ»áÔõô¡£¡£¡£¡±
µ±Îļþ±»¹ÒÔØµ½ Letta ÖÇÄÜÌåºó£¬£¬ÖÇÄÜÌåÄܹ»ÔËÓÃÒÔÏÂÎļþ²Ù×÷¹¤¾ß£º
¶Ô»°Êý¾Ý±»·Å½øÒ»¸öÎļþ²¢ÉÏ´«¹ÒÔØµ½ÖÇÄÜÌåÖС£¡£¡£Letta »á×Ô¶¯ÆÊÎö²¢Ç¶ÈëÎļþÄÚÈÝ£¬£¬ÒÔ±ã¾ÙÐÐÓïÒ壨ÏòÁ¿£©²éÕÒ¡£¡£¡£ÖÇÄÜÌåÄܹ»Óà search_files ×öÓïÒå²éÕÒ£¬£¬Óà grep ¾ÙÐÐÎı¾Æ¥Å䣬£¬ÔÙÓà answer_question »Ø¸´ÎÊÌâ¡£¡£¡£
ΪÁËÓë MemGPT µÄÔÊÔÑé¼á³ÖÒ»Ö£¬£¬Letta Óà GPT-4o mini ×÷Ϊģ×Ó¡£¡£¡£ÓÉÓÚ GPT-4o mini ²Å»ª½ÏÈõ£¬£¬Letta ÈÃÖÇÄÜÌ岿·Ö×ÔÖΣ¬£¬¾ÓɹæÔòÔ¼ÊøÆäŲÓù¤¾ßµÄÐÎʽ£º±ØÐèÏÈŲÓà search_files ²éÕÒÎļþ£¬£¬ÔÙÒ»Ö±²éÕÒÖ±µ½¾öÒéŲÓà answer_question ²¢Íê±Ï¡£¡£¡£²éÕÒʲô¡¢²éÕÒ¼¸¶à´ÎÓÉÖÇÄÜÌå×ÔÐоöÒé¡£¡£¡£
¡°Õâ¸ö¼òÂÔµÄÖÇÄÜÌåÔÚ GPT-4o mini ºÍ×îÉÙÌáÐѵ÷ÓŵÄÇéÐÎÏ£¬£¬¾ÍÔÚ LoCoMo ÉÏÈ¡µÃÁË 74.0% µÄЧ¹û£¬£¬ÏÔןßÓÚ Mem0 ³ÂÊöµÄÆä×î¼Ñͼ»ØÒä°æ±ðµÄ 68.5%¡£¡£¡£¡±
Letta ÒÔΪ£¬£¬ÏÖÔÚµÄÖÇÄÜÌåÔÚÔËÓù¤¾ß·½ÃæÊ®·Ö¸ßЧ£¬£¬ÓÈÆäÊÇÄÇЩºÜ»òÐí·ºÆðÔÚѵÁ·Êý¾ÝÖеŤ¾ß£¬£¬ÈçÎļþϵͳ²Ù×÷¡£¡£¡£Òò¶ø£¬£¬Ðí¶àÔÀ´Îªµ¥Ìø¼ìË÷ÍýÏëµÄרÓûØÒ乤¾ß£¬£¬»¹²»ÈçÖ±½ÓÈÃÖÇÄÜÌå×ÔÖ÷µü´ú²éÕÒÊý¾ÝÀ´µÃÓÐÓᣡ£¡£
ÖÇÄÜÌåÄܹ»ÌìÉú×Ô¼ºµÄ²éÕÒÅÌÎÊ£¬£¬¶ø²»µ«½öÊǼìË÷ÔʼÎÊÌ⣬£¬ÀýÈ罫 ¡°How does Calvin stay motivated when faced with setbacks?¡± ת»¯Îª ¡°Calvin motivation setbacks¡±£¬£¬²¢ÇÒÖÇÄÜÌåÄܹ»¼ÌÐø²éÕÒÖ±µ½ÕÒµ½×¼È·Êý¾Ý¡£¡£¡£
ÖÇÄÜÌåÊÇ·ñ¡°¼Ç×Å¡±ÁËijÊ£¬£¬È¡¾öÓÚËüÄÜ·ñÔÚÐèÇóʱÀֳɼìË÷µ½×¼È·ÐÅÏ¢¡£¡£¡£Òò¶ø£¬£¬¸üÖ÷ÒªµÄÊÇ˼Á¿ÖÇÄÜÌåÊÇ·ñÄܹ»ÓÐÓÃÔËÓüìË÷¹¤¾ß£¨ÖªµÀºÎʱÒÔ¼°ÔõôŲÓã©£¬£¬¶ø²»ÊǾÀ½áÓÚÏêϸµÄ¼ìË÷»úÖÆ£¨Èç֪ʶͼÆ×ÈÔÊÇÏòÁ¿Êý¾Ý¿â£©¡£¡£¡£
Letta »¹Ìá³ö£¬£¬ÏÖÔÚÖÇÄÜÌåÄܹ»Ê®·Ö¸ßЧµØÔËÓÃÎļþϵͳ¹¤¾ß£¬£¬ÔںܺéÁ÷ƽÉÏÊÇÓÉÓÚºóÆÚÓÅ»¯ÒªµãÇãÏòÖÇÄÜÌåµÄ±àÂëʹÃü¡£¡£¡£Ò»Ñùƽ³£À´Ëµ£¬£¬Ô½¼òÂԵŤ¾ßÔ½»òÐí·ºÆðÔÚÖÇÄÜÌåµÄѵÁ·Êý¾ÝÖУ¬£¬Ò²Ô½¼òÂÔ±»ÓÐÓÃÔËÓᣡ£¡£Ö»¹Ü¸üÔÓÂÒµÄÍýÏ루Èç֪ʶͼÆ×£©ÔÚÌØ¶¨ÁìÓò»òÐíÓÐÓ㬣¬µ«ËüÃÇ»òÐí¸üÄѱ» ´óÄ£×Ó£¨ÖÇÄÜÌ壩Ïàʶ¡£¡£¡£
¡°ÖÇÄÜÌåµÄ»ØÒä²Å»ªÈ¡¾öÓÚÖÇÄÜÌåµÄ¼Ü¹¹¡¢¹¤¾ßºÍµ×²ãÄ£×Ó¡£¡£¡£½ÏÁ¿ÖÇÄÜÌå½á¹¹Óë»ØÒ乤¾ß£¬£¬¾ÍÏñ½ÏÁ¿Æ»¹ûºÍéÙ×Ó£¬£¬ÓÉÓڽṹ¡¢¹¤¾ßºÍÄ£×Ó¶¼ÊÇÄܹ»×ÔÓÉ×éºÏµÄ¡£¡£¡£¡±Letta ˵µÀ¡£¡£¡£
ÄÇÔõô׼ȷÆÀ¼ÛÖÇÄÜÌ廨Òä²Å»ªÄØ£¿£¿
Letta ÏÈÒý¼öÁË×Ô¼ÒµÄ Letta Memory Benchmark£¨Letta ÅÅÐаñ£© ¹©Ó¦ÁËͬÀà±ÈÕÕ£¨apples-to-apples£©£¬£¬ÔÚ¼á³Ö½á¹¹£¨ÏÖÔÚ½ö Letta£©ºÍ¹¤¾ßÎȹ̵ÄÇéÐÎÏ£¬£¬ÆÀ¼Û²î±ðÄ£×ÓÔÚ»ØÒä°ìÀí·½ÃæµÄ²Å»ª¡£¡£¡£¸Ã»ù×¼ÔÚ¶¯Ì¬ÉÏÏÂÎÄÖм´Ê±ÌìÉú»ØÒä½»»¥³¡¾°£¬£¬È»ºóÆÀ¼ÛÖÇÄÜÌ廨Ò䣬£¬¶ø²»µ«½öÊǼìË÷²Å»ª£¨Èç LoCoMo£©¡£¡£¡£
È»ºóÖ¸³ö£¬£¬ÁíÒ»ÖÖ²½·¥ÊÇÖ±½ÓÆÀ¼ÛÖÇÄÜÌåÔÚÐèÇó»ØÒäµÄÏêϸʹÖÀÖеÄÈ«ÌåÌåÏÖ¡£¡£¡£ÀýÈç Terminal-Bench£¬£¬¿¼ÊÔÖÇÄÜÌå´¦Öóͷ£ÔÓÂÒ¡¢³¤Ê±¿ÌÔËתʹÃüµÄ²Å»ª¡£¡£¡£ÓÉÓÚʹÃüʱ¿Ì³¤ÇÒÐèÇó´¦Öóͷ£Ô¶³¬ÉÏÏÂÎÄ´°¿ÚµÄÐÅÏ¢£¬£¬ÖÇÄÜÌåÄܹ»ÔËÓûØÒä¶¢ÉÒʹÃü״̬ÓëÏ£Íû¡£¡£¡£
×îÖÕ£¬£¬Letta ×ܽáµÀ£¬£¬¹ØÓÚÍýÏëÓÅÒìµÄÖÇÄÜÌ壬£¬×ÝÈ»ÊǼòÂÔµÄÎļþϵͳ¹¤¾ß£¬£¬Ò²×ãÒÔÔÚ LoCoMo ÕâÑùµÄ¼ìË÷»ù×¼ÖÐÌåÏÖÓÅÒì¡£¡£¡£
²ÎÔÄÁ´½Ó£º
https://x.com/sarahwooders/status/1955352237490008570?s=46
https://www.letta.com/blog/benchmarking-ai-agent-memory
±¾ÎÄÀ´×Ô΢ÐŹ«¹²ºÅ¡°InfoQ¡±£¬£¬×÷ÕߣºñÒÐÓ¾ê £¬£¬36ë´¾ÊÚȨÐû²¼¡£¡£¡£