Các nhà khoa học đang sử dụng Claude để đẩy nhanh nghiên cứu và khám phá
Một nghiên cứu điển hình minh họa cách các nhà khoa học đang tận dụng sức mạnh của Claude để hợp lý hóa các quy trình nghiên cứu, tăng tốc độ khám phá và thúc đẩy những tiến bộ trong các lĩnh vực khoa học khác nhau.
- 17 min read
Khoa học gia sử dụng Claude để đẩy nhanh nghiên cứu và khám phá
Giới thiệu
Vào tháng 10 năm ngoái, Anthropic đã ra mắt Claude cho Khoa học Đời sống – một bộ công cụ kết nối và kỹ năng giúp Claude trở thành một cộng sự khoa học tốt hơn. Kể từ đó, công ty đã đầu tư mạnh mẽ vào việc phát triển Claude thành mô hình có khả năng cao nhất cho công việc khoa học, với Opus 4.5 cho thấy sự cải thiện đáng kể trong các bài kiểm tra về giải thích hình ảnh, sinh học tính toán và hiểu protein. Những tiến bộ này, được thông báo bởi các mối quan hệ đối tác với các nhà nghiên cứu trong học viện và công nghiệp, thể hiện cam kết của Anthropic trong việc hiểu cách các nhà khoa học đang sử dụng AI để đẩy nhanh tiến bộ.
Anthropic cũng đang làm việc chặt chẽ với các nhà khoa học thông qua chương trình AI cho Khoa học, cung cấp tín dụng API miễn phí cho các nhà nghiên cứu hàng đầu đang thực hiện các dự án khoa học có tác động cao trên toàn thế giới.
Những nhà nghiên cứu này đã phát triển các hệ thống tùy chỉnh sử dụng Claude theo những cách vượt xa các tác vụ như xem xét tài liệu hoặc hỗ trợ lập trình. Trong các phòng thí nghiệm mà Anthropic đã trao đổi, Claude là một cộng tác viên làm việc trên tất cả các giai đoạn của quy trình nghiên cứu: giúp việc hiểu thí nghiệm nào cần thực hiện trở nên dễ dàng và tiết kiệm chi phí hơn, sử dụng nhiều công cụ khác nhau để giúp nén các dự án thường mất hàng tháng thành vài giờ và tìm ra các mẫu trong các tập dữ liệu khổng lồ mà con người có thể bỏ qua. Trong nhiều trường hợp, nó giúp loại bỏ các điểm nghẽn, xử lý các tác vụ đòi hỏi kiến thức chuyên sâu và trước đây không thể mở rộng quy mô; trong một số trường hợp, nó cho phép các phương pháp nghiên cứu hoàn toàn khác với những gì các nhà nghiên cứu có thể thực hiện truyền thống.
Nói cách khác, Claude đang bắt đầu định hình lại cách các nhà khoa học này làm việc – và chỉ cho họ hướng tới những hiểu biết và khám phá khoa học mới lạ.
Biomni: Một tác nhân y sinh đa năng với quyền truy cập vào hàng trăm công cụ và cơ sở dữ liệu
Một điểm nghẽn trong nghiên cứu sinh học là sự phân mảnh của các công cụ: có hàng trăm cơ sở dữ liệu, gói phần mềm và quy trình có sẵn, và các nhà nghiên cứu dành thời gian đáng kể để lựa chọn và làm chủ các nền tảng khác nhau. Đó là thời gian lẽ ra, trong một thế giới lý tưởng, sẽ được dành cho việc chạy thí nghiệm, diễn giải dữ liệu hoặc theo đuổi các dự án mới.
Biomni, một nền tảng AI tác nhân từ Đại học Stanford, thu thập hàng trăm công cụ, gói và bộ dữ liệu vào một hệ thống duy nhất mà tác nhân được hỗ trợ bởi Claude có thể điều hướng. Các nhà nghiên cứu đưa ra yêu cầu bằng tiếng Anh đơn giản; Biomni tự động chọn các tài nguyên phù hợp. Nó có thể hình thành các giả thuyết, thiết kế các quy trình thí nghiệm và thực hiện phân tích trên hơn 25 lĩnh vực phụ của sinh học.
Hãy xem xét ví dụ về một nghiên cứu liên kết toàn bộ bộ gen (GWAS), một tìm kiếm các biến thể di truyền liên quan đến một đặc điểm hoặc bệnh tật nào đó. Ví dụ, khả năng cảm thụ âm nhạc hoàn hảo có cơ sở di truyền mạnh mẽ. Các nhà nghiên cứu sẽ lấy một nhóm lớn người – một số người có khả năng tạo ra một nốt nhạc mà không cần âm báo tham chiếu, và những người khác mà bạn sẽ không bao giờ mời đến karaoke – và quét bộ gen của họ để tìm các biến thể di truyền xuất hiện thường xuyên hơn ở một nhóm hơn nhóm kia.
Việc quét bộ gen là (tương đối) đơn giản. Chính quá trình phân tích và xử lý dữ liệu mới tốn thời gian: dữ liệu bộ gen có nhiều định dạng lộn xộn và cần được làm sạch kỹ lưỡng; các nhà nghiên cứu phải kiểm soát các yếu tố gây nhiễu và xử lý dữ liệu bị thiếu; khi họ xác định được bất kỳ “kết quả” nào, họ cần tìm ra ý nghĩa thực sự của chúng – gen nào ở gần (vì GWAS chỉ ra các vị trí trong bộ gen), chúng được biểu hiện ở loại tế bào nào, con đường sinh học nào mà chúng có thể ảnh hưởng, v.v. Mỗi bước có thể liên quan đến các công cụ khác nhau, định dạng tệp khác nhau và nhiều quyết định thủ công. Đó là một quy trình tẻ nhạt. Một GWAS duy nhất có thể mất hàng tháng. Nhưng trong một thử nghiệm ban đầu với Biomni, nó chỉ mất 20 phút.
Điều này có vẻ quá tốt để trở thành sự thật – chúng ta có thể chắc chắn về độ chính xác của loại phân tích AI này không? Nhóm Biomni đã xác thực hệ thống thông qua nhiều nghiên cứu điển hình trong các lĩnh vực khác nhau. Trong một nghiên cứu, Biomni đã thiết kế một thí nghiệm nhân bản phân tử; trong một đánh giá mù, quy trình và thiết kế đã khớp với một nghiên cứu sinh sau với hơn năm năm kinh nghiệm. Trong một nghiên cứu khác, Biomni đã phân tích dữ liệu từ hơn 450 tệp dữ liệu đeo được từ 30 người khác nhau (hỗn hợp theo dõi glucose liên tục, nhiệt độ và hoạt động thể chất) chỉ trong 35 phút – một nhiệm vụ ước tính mất ba tuần để một chuyên gia thực hiện. Trong nghiên cứu thứ ba, Biomni đã phân tích dữ liệu hoạt động gen từ hơn 336.000 tế bào riêng lẻ lấy từ mô phôi thai người. Hệ thống đã xác nhận các mối quan hệ điều hòa mà các nhà khoa học đã biết, nhưng cũng xác định các yếu tố phiên mã mới – protein kiểm soát việc gen bật hoặc tắt – mà trước đây các nhà nghiên cứu chưa từng kết nối với sự phát triển phôi thai của con người.
Biomni không phải là một hệ thống hoàn hảo, đó là lý do tại sao nó bao gồm các biện pháp bảo vệ để phát hiện nếu Claude đi sai hướng. Nó cũng chưa thể làm mọi thứ ngay lập tức. Tuy nhiên, nếu nó gặp khó khăn, các chuyên gia có thể mã hóa phương pháp luận của họ dưới dạng một kỹ năng – dạy tác nhân cách một chuyên gia có thể tiếp cận một vấn đề, thay vì để nó tự ứng biến. Ví dụ, khi làm việc với Mạng lưới Bệnh Không Chẩn đoán để chẩn đoán bệnh hiếm, nhóm nghiên cứu nhận thấy rằng cách tiếp cận mặc định của Claude khác đáng kể so với những gì một bác sĩ lâm sàng sẽ làm. Vì vậy, họ đã phỏng vấn một chuyên gia, ghi lại quy trình chẩn đoán từng bước và dạy nó cho Claude. Với kiến thức mới, trước đây ngầm định này, tác nhân đã hoạt động tốt.
Biomni đại diện cho một cách tiếp cận: một hệ thống đa năng mang hàng trăm công cụ dưới một mái nhà. Nhưng các phòng thí nghiệm khác đang xây dựng các hệ thống chuyên biệt hơn – nhắm mục tiêu vào các điểm nghẽn cụ thể trong quy trình nghiên cứu của họ.
Phòng thí nghiệm Cheeseman: Tự động hóa diễn giải các thí nghiệm knockout gen quy mô lớn
Khi các nhà khoa học muốn hiểu một gen làm gì, một cách tiếp cận là loại bỏ nó khỏi tế bào hoặc sinh vật đang được xem xét và xem điều gì bị hỏng. Công cụ chỉnh sửa gen CRISPR, xuất hiện vào khoảng năm 2012, đã giúp việc này dễ dàng thực hiện ở quy mô lớn. Nhưng tiện ích của CRISPR vẫn còn hạn chế: các phòng thí nghiệm có thể tạo ra nhiều dữ liệu hơn là họ có khả năng phân tích.
Đây chính xác là thách thức mà phòng thí nghiệm của Iain Cheeseman tại Viện Whitehead và Khoa Sinh học tại MIT phải đối mặt. Sử dụng CRISPR, họ loại bỏ hàng nghìn gen khác nhau trên hàng chục triệu tế bào người, sau đó chụp ảnh từng tế bào để xem điều gì đã thay đổi. Các mẫu trong những hình ảnh đó cho thấy rằng các gen có cùng chức năng có xu hướng tạo ra các tổn thương có hình dạng tương tự khi bị loại bỏ. Phần mềm có thể phát hiện các mẫu này và nhóm các gen lại với nhau một cách tự động – phòng thí nghiệm của Cheeseman đã xây dựng một quy trình để làm chính xác điều này có tên là Brieflow (vâng, là brie phô mai).
Nhưng việc diễn giải ý nghĩa của các nhóm gen này – tại sao các gen lại nhóm lại với nhau, chúng có điểm gì chung, liệu đó có phải là một mối quan hệ sinh học đã biết hay một cái gì đó mới – vẫn đòi hỏi một chuyên gia phải lục lọi qua các tài liệu khoa học, từng gen một. Điều này rất chậm. Một màn hình duy nhất có thể tạo ra hàng trăm cụm, và hầu hết không bao giờ được điều tra đơn giản vì các phòng thí nghiệm không có thời gian, khả năng hoặc kiến thức chuyên sâu về những điều đa dạng mà tế bào thực hiện.
Trong nhiều năm, Cheeseman đã tự mình thực hiện tất cả các diễn giải. Ông ước tính rằng mình có thể nhớ chức năng của khoảng 5.000 gen, nhưng vẫn mất hàng trăm giờ để phân tích dữ liệu này một cách hiệu quả. Để đẩy nhanh quá trình này, sinh viên tiến sĩ Matteo Di Bernardo đã tìm cách xây dựng một hệ thống tự động hóa phương pháp tiếp cận của Cheeseman. Làm việc chặt chẽ với Cheeseman để hiểu chính xác cách ông ấy tiếp cận việc diễn giải – ông ấy tham khảo nguồn dữ liệu nào, ông ấy tìm kiếm những mẫu nào, điều gì làm cho một phát hiện trở nên thú vị – họ đã xây dựng một hệ thống được hỗ trợ bởi Claude có tên là MozzareLLM (bạn có thể nhận thấy một chủ đề đang phát triển ở đây).
Nó lấy một cụm gen và thực hiện những gì một chuyên gia như Cheeseman sẽ làm: xác định quy trình sinh học mà chúng có thể chia sẻ, đánh dấu những gen nào được hiểu rõ và những gen nào ít được nghiên cứu, và làm nổi bật những gen nào có thể đáng để theo dõi. Điều này không chỉ đẩy nhanh công việc của họ một cách đáng kể mà còn giúp họ đưa ra những khám phá sinh học bổ sung quan trọng. Cheeseman nhận thấy Claude liên tục bắt được những điều mà ông ấy đã bỏ lỡ. “Mỗi lần tôi xem lại, tôi đều nghĩ, tôi đã không để ý đến cái đó! Và trong mỗi trường hợp, đây là những khám phá mà chúng ta có thể hiểu và xác minh,” ông nói.
Điều làm cho MozzareLLM hữu ích là nó không phải là một sản phẩm chỉ có một công dụng: nó có thể kết hợp thông tin đa dạng và lý luận như một nhà khoa học. Quan trọng nhất, nó cung cấp các mức độ tin cậy trong các phát hiện của mình, điều mà Cheeseman nhấn mạnh là rất quan trọng. Nó giúp ông quyết định có nên đầu tư thêm nguồn lực để theo dõi các kết luận của nó hay không.
Trong quá trình xây dựng MozzareLLM, Di Bernardo đã thử nghiệm nhiều mô hình AI. Claude đã vượt trội hơn các giải pháp thay thế – trong một trường hợp, nó đã xác định chính xác một con đường sửa đổi RNA mà các mô hình khác đã bác bỏ là nhiễu ngẫu nhiên.
Cheeseman và Di Bernardo hình dung việc công khai các tập dữ liệu được chú thích bởi Claude này – cho phép các chuyên gia trong các lĩnh vực khác theo dõi các cụm mà phòng thí nghiệm của ông không có thời gian theo đuổi. Ví dụ, một nhà sinh vật học ty thể có thể đi sâu vào các cụm ty thể mà nhóm của Cheeseman đã đánh dấu nhưng chưa bao giờ điều tra. Khi các phòng thí nghiệm khác áp dụng MozzareLLM cho các thí nghiệm CRISPR của riêng họ, nó có thể đẩy nhanh việc diễn giải và xác nhận các gen mà chức năng của chúng vẫn chưa được đặc trưng trong nhiều năm.
Phòng thí nghiệm Lundberg: Kiểm tra việc tạo giả thuyết do AI dẫn đầu về các gen cần nghiên cứu
Phòng thí nghiệm Cheeseman sử dụng sàng lọc tổng hợp quang học – một kỹ thuật cho phép họ loại bỏ hàng nghìn gen trong một thí nghiệm duy nhất. Điểm nghẽn của họ là diễn giải. Nhưng không phải tất cả các loại tế bào đều hoạt động với các phương pháp tổng hợp. Một số phòng thí nghiệm, chẳng hạn như Phòng thí nghiệm Lundberg tại Stanford, chạy các sàng lọc nhỏ hơn, tập trung và điểm nghẽn của họ đến sớm hơn: quyết định nên nhắm mục tiêu vào gen nào ngay từ đầu.
Vì một sàng lọc tập trung duy nhất có thể tốn hơn 20.000 đô la và chi phí tăng lên theo kích thước, các phòng thí nghiệm thường nhắm mục tiêu vào vài trăm gen mà họ cho là có khả năng nhất liên quan đến một tình trạng nhất định. Quy trình thông thường bao gồm một nhóm sinh viên sau đại học và các nhà nghiên cứu sau tiến sĩ ngồi quanh một bảng tính Google, thêm các gen ứng cử viên từng cái một với một câu giải thích, hoặc có thể là một liên kết đến một bài báo. Đó là một trò chơi đoán có cơ sở, được thông báo bởi các bài đánh giá tài liệu, kinh nghiệm và trực giác, nhưng bị giới hạn bởi khả năng của con người. Nó cũng dễ sai sót, dựa trên những gì các nhà khoa học khác đã tìm ra và ghi lại, và những gì con người trong phòng tình cờ nhớ ra.
Phòng thí nghiệm Lundberg đang sử dụng Claude để đảo ngược cách tiếp cận đó. Thay vì hỏi “chúng ta có thể đưa ra những phỏng đoán nào dựa trên những gì các nhà nghiên cứu đã nghiên cứu?”, hệ thống của họ hỏi “nên nghiên cứu cái gì, dựa trên các đặc tính phân tử?”
Nhóm đã xây dựng một bản đồ của mọi phân tử đã biết trong tế bào – protein, RNA, DNA – và cách chúng liên quan đến nhau. Họ đã lập bản đồ các protein nào liên kết với nhau, gen nào mã hóa cho sản phẩm nào và phân tử nào có cấu trúc tương tự. Sau đó, họ có thể đưa cho Claude một mục tiêu – ví dụ, gen nào có thể điều khiển một cấu trúc hoặc quá trình tế bào cụ thể – và Claude sẽ điều hướng bản đồ đó để xác định các gen ứng cử viên dựa trên các đặc tính và mối quan hệ sinh học của chúng.
Phòng thí nghiệm Lundberg hiện đang thực hiện một thí nghiệm để nghiên cứu xem cách tiếp cận này hoạt động tốt như thế nào. Để làm được điều đó, họ cần xác định một chủ đề mà rất ít nghiên cứu đã được thực hiện (nếu họ đã xem xét một cái gì đó được nghiên cứu kỹ lưỡng, Claude có thể đã biết về các kết quả đã được thiết lập). Họ đã chọn lông mao nguyên phát: các phần phụ giống như ăng-ten trên tế bào mà chúng ta vẫn còn biết ít về chúng nhưng chúng có liên quan đến một loạt các rối loạn phát triển và thần kinh. Tiếp theo, họ sẽ chạy sàng lọc toàn bộ bộ gen để xem gen nào thực sự ảnh hưởng đến sự hình thành lông mao, và thiết lập sự thật cơ bản.
Thử nghiệm là so sánh các chuyên gia con người với Claude. Con người sẽ sử dụng phương pháp bảng tính để đưa ra phỏng đoán của họ. Claude sẽ tạo ra phỏng đoán của riêng mình bằng cách sử dụng bản đồ mối quan hệ phân tử. Nếu Claude bắt được (theo giả thuyết) 150 trong số 200, và con người bắt được 80 trong số 200, đó là bằng chứng cho thấy cách tiếp cận hoạt động tốt hơn. Ngay cả khi họ ngang bằng nhau trong việc phát hiện ra các gen, thì Claude vẫn có khả năng hoạt động nhanh hơn nhiều và có thể làm cho toàn bộ quy trình nghiên cứu hiệu quả hơn.
Nếu cách tiếp cận này hoạt động, nhóm nghiên cứu hình dung nó sẽ trở thành bước đầu tiên tiêu chuẩn trong sàng lọc nhiễu loạn tập trung. Thay vì đánh cược dựa trên trực giác hoặc sử dụng các phương pháp vũ lực đã trở nên phổ biến trong nghiên cứu đương đại, các phòng thí nghiệm có thể đưa ra các lựa chọn sáng suốt về việc nên nhắm mục tiêu vào gen nào – đạt được kết quả tốt hơn mà không cần cơ sở hạ tầng cho sàng lọc toàn bộ bộ gen.
Hướng tới tương lai
Không có hệ thống nào trong số này là hoàn hảo. Nhưng chúng chỉ ra những cách mà chỉ trong vài năm, các nhà khoa học đã bắt đầu tích hợp AI như một đối tác nghiên cứu có khả năng làm được nhiều hơn các tác vụ cơ bản – thực sự, ngày càng có khả năng tăng tốc, và trong một số trường hợp, thậm chí thay thế, nhiều khía cạnh khác nhau của quy trình nghiên cứu.
Khi nói chuyện với các phòng thí nghiệm này, một chủ đề chung đã xuất hiện: tính hữu ích của các công cụ mà họ đã xây dựng tiếp tục phát triển cùng với khả năng của AI. Mỗi bản phát hành mô hình mang lại những cải tiến đáng chú ý. Chỉ hai năm trước, các mô hình trước đây bị giới hạn ở việc viết mã hoặc tóm tắt các bài báo, các tác nhân mạnh mẽ hơn đã bắt đầu, dù chậm rãi, tái tạo chính công việc mà các bài báo đó mô tả.
Khi các công cụ phát triển và các mô hình AI tiếp tục phát triển thông minh hơn, Anthropic sẽ tiếp tục theo dõi và học hỏi từ cách khám phá khoa học phát triển cùng với chúng.
Để biết thêm chi tiết về các khả năng mở rộng của Claude cho Khoa học Đời sống, hãy xem tại đây, và các hướng dẫn của chúng tôi tại đây. Anthropic cũng đang tiếp tục chấp nhận các đơn đăng ký cho chương trình AI cho Khoa học của họ. Các đơn đăng ký sẽ được xem xét bởi đội ngũ, bao gồm các chuyên gia về chủ đề trong các lĩnh vực liên quan.