Điểm đáng chú ý nhất là khả năng "lập luận lai" (hybrid reasoning), giúp mô hình giải quyết các vấn đề yêu cầu nhiều bước suy luận một cách hiệu quả hơn.
Đơn giản hóa tính năng "lập luận" thay vì "mô hình"
Trong khi các công ty như OpenAI và những đối thủ khác đang cung cấp các mô hình “lập luận” riêng biệt, bà Dianne Penn, Trưởng nhóm Nghiên cứu Sản phẩm của Anthropic, giải thích với The Verge rằng công ty của bà muốn "đơn giản hóa trải nghiệm sử dụng AI, tránh việc phải sử dụng nhiều mô hình riêng biệt".
Theo bà, "lập luận (reasoning)" không nên là một tính năng tách biệt mà phải là một phần tự nhiên của AI. Điều này có nghĩa là, thay vì phải chuyển sang một mô hình khác khi yêu cầu lập luận phức tạp, Claude 3.7 của Anthropic có thể xử lý cả những câu hỏi đơn giản như “Mấy giờ rồi?” đến các yêu cầu phức tạp hơn, như “Lập kế hoạch chuyến đi hai tuần đến Ý trong tháng Ba, với lưu ý về thời tiết.”
Cách tiếp cận này giúp Claude trở nên linh hoạt hơn và dễ sử dụng hơn, vì người dùng không cần phải lo lắng về việc chọn mô hình phù hợp cho từng loại tác vụ. Thay vào đó, AI có thể tự động ứng dụng khả năng lập luận trong tất cả các tình huống mà không cần phân chia rõ ràng giữa các loại tác vụ đơn giản và phức tạp.
Lập trình mạnh mẽ hơn
Bên cạnh mô hình mới, Anthropic cũng cho ra mắt "AI agent" mang tên Claude Code (mặc dù chỉ mới ở chế độ nghiên cứu giới hạn "Limited Research Preview").
Khác với Cursor, cũng là một công cụ hỗ trợ lập trình, Claude Code có thể hỗ trợ lập trình viên "chủ động hơn, phối hợp tốt hơn" trong việc đọc hiểu, sửa code, chạy thử nghiệm code, "commit" lên Github, sử dụng được cả dòng lệnh "command line".
Cao cấp hơn, Anthropic cho phép các lập trình viên có thể can thiệp và điều chỉnh cách thức mà AI “suy nghĩ” thông qua tính năng "scratchpad". Thậm chí, các lập trình viên có thể xác định chính xác thời gian phản hồi mà họ mong muốn. Ví dụ, họ có thể yêu cầu AI trả lời một câu hỏi nào đó trong thời gian tối đa là 200 mili giây.
Như ông Michael Gerstenhaber, Phó Chủ tịch sản phẩm của Anthropic, đã nói: “Đôi khi, lập trình viên chỉ cần nói rằng câu trả lời không nên mất quá 200 mili giây. Đây là một quyết định về mặt trải nghiệm sản phẩm, phản ánh sự linh hoạt và khả năng tùy chỉnh sâu của mô hình trong việc đáp ứng các yêu cầu cụ thể của ứng dụng".
Trong các thử nghiệm nội bộ, Claude 3.7 Sonnet thể hiện khả năng giải quyết những nhiệm vụ phức tạp một cách ấn tượng. Đặc biệt, phiên bản này có thể lập kế hoạch nhiều bước và thậm chí tham gia vào các trò chơi như Pokémon với chiến lược hợp lý hơn.
Tăng tốc cuộc chạy đua AI
Hiện tại, Claude 3.7 Sonnet vẫn không có khả năng tìm kiếm trực tuyến "real-time" như một số đối thủ, nhưng công ty nhấn mạnh rằng phiên bản này có thể thực hiện nhiều tác vụ tự động tốt hơn trong các lĩnh vực như lập trình, tài chính, pháp lý. Kiến thức của phiên bản này cũng được cập nhật đến tháng 10/2024.
Claude 3.7 Sonnet có sẵn trên ứng dụng Claude, cũng như qua API của Anthropic, Amazon Bedrock và Vertex AI của Google Cloud. Giá cả vẫn tương đương với phiên bản trước, với mức phí $3 cho mỗi triệu token đầu vào và $15 cho mỗi triệu token đầu ra.
Bản cập nhật này cho thấy tham vọng của Anthropic trong việc tạo ra các mô hình AI ngày càng thông minh và đa chức năng hơn. Với Claude 3.7 Sonnet, công ty đang củng cố vị trí của mình trong cuộc đua AI ngày càng khốc liệt.