Cửa hàng DApp | Trung tâm Web3 với các sự kiện và trò chơi

Chủ đề thịnh hành

Có một tiêu chuẩn mới cho các tác nhân lập trình AI: SWE-Bench Pro trong bài kiểm tra khó hơn, theo kiểu doanh nghiệp này, GPT-5 đạt ~23,3% trên bộ công khai (so với 70%+ trên SWE-Bench Verified) nó bao gồm 1.865 vấn đề dài, đa tệp được xác minh bởi con người từ 41 kho lưu trữ đang hoạt động trên các bộ công khai, giữ lại và thương mại.

Hàng đầu

Thứ hạng

Yêu thích