Một mô hình của OpenAI đã bác bỏ một giả thuyết trung tâm trong hình học rời rạc

Bài từ OpenAI, dịch bởi Gemini.

Trong gần 80 năm qua, các nhà toán học đã nghiên cứu một câu hỏi tưởng chừng đơn giản: nếu bạn đặt $n$ điểm trên mặt phẳng, có bao nhiêu cặp điểm có khoảng cách bằng đúng 1?

Đây là bài toán khoảng cách đơn vị trên mặt phẳng, được Paul Erdős đề xuất lần đầu tiên vào năm 1946. Nó là một trong những câu hỏi nổi tiếng nhất trong hình học tổ hợp, dễ phát biểu nhưng lại đặc biệt khó giải quyết. Cuốn sách năm 2005 Research Problems in Discrete Geometry (Các vấn đề nghiên cứu trong Hình học Rời rạc) của Brass, Moser và Pach, gọi nó là “có lẽ là bài toán được biết đến nhiều nhất (và dễ giải thích nhất) trong hình học tổ hợp.” Noga Alon, một chuyên gia hàng đầu về tổ hợp tại Đại học Princeton, mô tả đây là “một trong những bài toán yêu thích của Erdős.” Erdős thậm chí còn từng treo thưởng tiền mặt cho ai giải quyết được bài toán này.

Hôm nay, chúng tôi chia sẻ một bước đột phá về bài toán khoảng cách đơn vị. Kể từ công trình nguyên bản của Erdős, niềm tin phổ biến luôn là các cấu hình “lưới vuông” về cơ bản đã là tối ưu nhất để tối đa hóa số lượng các cặp có khoảng cách bằng 1. Một mô hình nội bộ của OpenAI đã bác bỏ giả thuyết tồn tại từ lâu này, cung cấp một họ vô hạn các ví dụ mang lại sự cải thiện theo đa thức (polynomial improvement). Lời chứng minh này đã được kiểm tra bởi một nhóm các nhà toán học độc lập bên ngoài. Họ cũng đã viết một bài báo đồng hành giải thích lập luận, đồng thời cung cấp thêm kiến thức nền và bối cảnh cho tầm quan trọng của kết quả này.

Kết quả này cũng đáng chú ý ở chính cách nó được tìm ra. Lời chứng minh xuất phát từ một mô hình suy luận đa dụng mới, thay vì một hệ thống được huấn luyện chuyên biệt cho toán học, hay được thiết kế thuật toán tìm kiếm qua các chiến lược chứng minh, hoặc nhắm mục tiêu cụ thể vào bài toán khoảng cách đơn vị. Là một phần của nỗ lực rộng lớn hơn nhằm kiểm tra xem các mô hình tiên tiến có thể đóng góp cho nghiên cứu tuyến đầu hay không, chúng tôi đã đánh giá nó trên một tập hợp các bài toán của Erdős. Trong trường hợp này, nó đã đưa ra một lời giải chứng minh trọn vẹn bài toán mở này.

Chứng minh này là một cột mốc quan trọng đối với cả cộng đồng toán học và AI. Nó đánh dấu lần đầu tiên một bài toán mở nổi bật, mang tính trọng tâm của một phân ngành toán học, được giải quyết một cách tự động bởi AI. Nó cũng chứng minh chiều sâu suy luận mà các hệ thống này hiện có thể hỗ trợ. Toán học cung cấp một nền tảng thử nghiệm đặc biệt rõ ràng cho khả năng suy luận: các bài toán rất chính xác, các chứng minh tiềm năng có thể được kiểm tra, và một lập luận dài chỉ có giá trị nếu logic được kết nối chặt chẽ từ đầu đến cuối. Phương pháp giải quyết bài toán cũng rất đáng chú ý. Lời giải đã mang những ý tưởng phức tạp, bất ngờ từ lý thuyết số đại số (algebraic number theory) để áp dụng vào một câu hỏi hình học sơ cấp.

Chủ nhân huy chương Fields Tim Gowers, viết trong bài báo đồng hành, gọi kết quả này là “một cột mốc trong toán học AI.” Theo nhà lý thuyết số hàng đầu Arul Shankar, “Theo ý kiến của tôi, bài báo này chứng minh rằng các mô hình AI hiện tại không chỉ dừng lại ở vai trò trợ lý cho các nhà toán học con người – chúng có khả năng tạo ra những ý tưởng nguyên bản đầy khéo léo, và sau đó đưa chúng đến thành quả cuối cùng”.

Ý kiến của các nhà toán học về kết quả này:

Noga Alon: “Đây là một trong những bài toán yêu thích của Erdős, chính tôi đã nghe ông nhắc đến bài toán này nhiều lần trong các bài giảng của mình. Tôi tin rằng có thể nói công bằng rằng mọi nhà toán học làm việc trong lĩnh vực Hình học Tổ hợp đều đã từng nghĩ về bài toán này, và rất nhiều nhà toán học làm việc ở các lĩnh vực khác cũng đã dành ít nhất một chút thời gian để suy nghĩ về nó… Giải pháp cho bài toán từ mô hình nội bộ của Open AI, theo ý kiến của tôi, là một thành tựu xuất sắc, giải quyết dứt điểm một bài toán mở đã tồn tại từ lâu. Việc đáp án đúng không phải là $n^{1+o(1)}$ là một điều đáng ngạc nhiên, và cách xây dựng cấu hình cùng phân tích của nó đã áp dụng các công cụ khá phức tạp từ lý thuyết số đại số một cách thanh lịch và thông minh.”
Tim Gowers: “Không có nghi ngờ gì rằng giải pháp cho bài toán khoảng cách đơn vị là một cột mốc trong toán học AI: nếu một con người viết bài báo này và gửi cho tờ Annals of Mathematics và tôi được yêu cầu đưa ra ý kiến nhanh, tôi sẽ đề nghị chấp nhận mà không hề do dự. Chưa có chứng minh nào do AI tạo ra trước đây có thể tiến gần đến mức đó.”
Arul Shankar: “Chuỗi suy luận (CoT) của mô hình cực kỳ thú vị. Đáng chú ý là phần lớn các luồng suy nghĩ đều cố gắng xây dựng một phản ví dụ cho giới hạn trên (upper bound) vốn được nhiều người tin tưởng, thay vì cố gắng chứng minh nó. Điều này lập luận rằng mô hình có sự kết hợp của trực giác tốt, sự sẵn sàng thử các phương pháp tiếp cận mà cộng đồng coi là ‘mò kim đáy bể’ (long-shot), và một thiên hướng nỗ lực xây dựng các cấu hình… Theo ý kiến của tôi, bài báo này chứng minh rằng các mô hình AI hiện tại không chỉ là những người trợ lý cho các nhà toán học con người – chúng có khả năng có những ý tưởng nguyên bản khéo léo, và đưa chúng đến kết quả cuối cùng.”
Jacob Tsimerman: “Đây là một tác phẩm thực sự ấn tượng, và tôi sẽ chấp nhận nó cho bất kỳ tạp chí nào mà không ngần ngại. Tôi thực sự đã từng nghiên cứu bài toán này một thời gian ngắn và cố gắng tạo ra một phản ví dụ, nhưng không tiến triển được… Chắc chắn đây là một cấu hình rất đáng sợ để đọc hiểu ngay cả khi bạn biết những gì đang diễn ra, và thậm chí còn khó hơn nhiều để tự mình triển khai.”

Bài toán khoảng cách đơn vị

Cho $u(n)$ là số lượng lớn nhất có thể của các cặp khoảng cách đơn vị trong số $n$ điểm trên mặt phẳng. Rất dễ để xây dựng các ví dụ đạt được tốc độ tăng trưởng tuyến tính: đặt $n$ điểm trên một đường thẳng sẽ cho $n-1$ cặp, trong khi một lưới vuông cho khoảng $2n$ cặp. Cấu hình tốt nhất được biết đến trước đây, xuất phát từ một lưới vuông được thu phóng, hóa ra lại cho nhiều hơn thế: $n^{1 + C / \log \log(n)}$ với $C$ là một hằng số. Vì $\log \log(n)$ tiến đến vô cùng theo $n$ , nên số hạng bổ sung trong số mũ tiến đến 0, có nghĩa là các cấu hình này đạt được tốc độ tăng trưởng chỉ nhanh hơn tuyến tính một chút. Trong nhiều thập kỷ, người ta tin rộng rãi rằng tốc độ này về cơ bản là tốt nhất có thể, và không có cấu hình nào có thể cải thiện đáng kể so với lưới vuông. Về mặt kỹ thuật, Erdős phỏng đoán một giới hạn trên là $n^{1+o(1)}$ trong đó $o(1)$ chỉ ra một số hạng tiến tới 0 theo $n$ .

Kết quả mới của chúng tôi đã bác bỏ giả thuyết này. Chính xác hơn, với vô hạn giá trị của $n$ , lời chứng minh xây dựng các cấu hình gồm $n$ điểm với ít nhất $n^{1+\delta}$ cặp khoảng cách đơn vị, với một số mũ cố định $\delta > 0$ . (Lời chứng minh AI gốc không đưa ra một $\delta$ cụ thể, nhưng một tinh chỉnh sắp tới do giáo sư toán học Will Sawin của Princeton thực hiện đã chỉ ra rằng người ta có thể lấy $\delta=0.014$ ).

Lịch sử của bài toán giúp chúng ta thấy tại sao kết quả này lại đáng kinh ngạc. Giới hạn dưới (lower bound) tốt nhất được biết đến về cơ bản đã không thay đổi kể từ cấu hình nguyên bản năm 1946 của Erdős. Giới hạn trên tốt nhất, $O(n^{4/3})$ , có từ công trình của Spencer, Szemerédi, và Trotter năm 1984, và mặc dù sau đó có những tinh chỉnh và công trình cấu trúc liên quan của Székely, Katz và Silier, Pach, Raz, và Solymosi cùng những người khác, giới hạn trên này về cơ bản vẫn không thay đổi. Như một bằng chứng ủng hộ cho giả thuyết, Matoušek và Alon-Bucić-Sauermann đã nghiên cứu bài toán với các khoảng cách phi Euclid trên mặt phẳng, và chứng minh rằng “phần lớn” các khoảng cách phi Euclid này tuân theo giả thuyết theo một nghĩa nào đó.

Đáng ngạc nhiên là, các thành phần cốt lõi của cấu hình lại đến từ một phần rất khác của toán học được gọi là lý thuyết số đại số, nghiên cứu các khái niệm như phân tích nhân tử trong các phần mở rộng của số nguyên được gọi là các trường số đại số (algebraic number fields).

Những kỹ thuật mới từ lý thuyết số đại số

Ở mức độ tổng quan, lời chứng minh bắt đầu với một ý tưởng hình học quen thuộc và đẩy nó theo một hướng bất ngờ.

Giới hạn dưới ban đầu của Erdős có thể được hiểu thông qua các số nguyên Gauss (Gaussian integers): các số có dạng $a+bi$ , trong đó $a$ và $b$ là các số nguyên và $i$ là căn bậc hai của $-1$ . Số nguyên Gauss mở rộng các số nguyên thông thường và, giống như chúng, có được các đặc tính như phân tích duy nhất thành các số nguyên tố. Những sự mở rộng như vậy của số nguyên hoặc số hữu tỉ thông thường được gọi là các trường số đại số. Lập luận mới thay thế các số nguyên Gauss bằng các dạng tổng quát hóa phức tạp hơn từ lý thuyết số đại số với các tính đối xứng phong phú hơn, có thể tạo ra nhiều hơn đáng kể các hiệu số có độ dài bằng đơn vị.

Lập luận chính xác sử dụng các công cụ như tháp trường lớp vô hạn (infinite class field towers) và lý thuyết Golod–Shafarevich để chứng minh rằng các trường số cần thiết cho lập luận thực sự tồn tại. Những ý tưởng này rất quen thuộc đối với các nhà lý thuyết số đại số, nhưng thật là một bất ngờ lớn khi những khái niệm này lại có ý nghĩa đối với các câu hỏi hình học trong mặt phẳng Euclid.

Ý nghĩa của điều này đối với toán học

Kết quả này đánh dấu một khoảnh khắc quan trọng trong sự tương tác giữa AI và toán học: một hệ thống AI đã tự động giải quyết một bài toán mở tồn tại từ lâu, đóng vai trò trung tâm của một lĩnh vực đang hoạt động tích cực. Nó cũng mang đến cái nhìn thoáng qua sớm về một kiểu hợp tác mới giữa AI và các nhà toán học con người. Trong trường hợp này, công trình đồng hành của các nhà toán học bên ngoài đã vẽ nên một bức tranh phong phú hơn rất nhiều so với chỉ riêng lời giải nguyên bản.

Như Thomas Bloom viết trong ghi chú đồng hành:

“Khi đánh giá tầm quan trọng và sự ảnh hưởng của một chứng minh do AI tạo ra, câu hỏi tôi tự đặt ra cho mình là: điều này có dạy chúng ta điều gì mới về bài toán không? Hiện tại chúng ta có hiểu hình học rời rạc tốt hơn không? Tôi nghĩ câu trả lời là một từ ‘có’ có chừng mực: điều này cho thấy rằng các cấu hình lý thuyết số có nhiều điều để nói về những dạng câu hỏi này hơn chúng ta tưởng; hơn nữa, phần lý thuyết số được yêu cầu có thể rất sâu sắc. Không nghi ngờ gì nữa, nhiều nhà lý thuyết số đại số sẽ xem xét kỹ lưỡng các bài toán mở khác trong hình học rời rạc trong những tháng tới.”

Sự kết nối bất ngờ giữa lý thuyết số đại số và hình học rời rạc được bộc lộ bởi lời giải là một phần khiến kết quả này trở nên đáng chú ý. Nó không đơn thuần giải quyết một giả thuyết cụ thể, mà còn có thể cung cấp cho các nhà toán học một cây cầu để bắt đầu khám phá thêm các bài toán liên quan khác.

Bloom cũng hướng tới một khả năng rộng lớn hơn:

“Ranh giới của tri thức phát triển như những mũi nhọn (rất không đồng đều), và không có gì phải nghi ngờ rằng trong những tháng và năm tới sẽ chứng kiến những thành công tương tự trong nhiều lĩnh vực toán học khác, nơi các bài toán mở tồn tại từ lâu được giải quyết bởi một AI bộc lộ những kết nối bất ngờ và đẩy bộ máy kỹ thuật hiện tại đến giới hạn của nó. AI đang giúp chúng ta khám phá trọn vẹn hơn thánh đường toán học mà chúng ta đã xây dựng qua nhiều thế kỷ; những kỳ quan chưa từng thấy nào khác đang chực chờ phía sau cánh gà?”

Kết quả này cung cấp một ví dụ đầy hứa hẹn: AI không chỉ đóng góp một lời giải, mà còn là một sự khám phá toán học mà ý nghĩa của nó trở nên rõ ràng và phong phú hơn thông qua sự thấu hiểu tiếp nối của con người.

Tại sao điều này lại quan trọng

Bài học rút ra còn lớn hơn kết quả cụ thể này. Khả năng suy luận toán học tốt hơn có thể biến AI thành một đối tác nghiên cứu mạnh mẽ hơn: một thứ có thể gắn kết các luồng tư duy khó nhằn lại với nhau, kết nối các ý tưởng giữa các mảng kiến thức xa lạ, phát hiện ra các con đường đầy hứa hẹn mà các chuyên gia có thể chưa ưu tiên, và giúp các nhà nghiên cứu đạt được tiến bộ trên những bài toán mà nếu không có nó, sẽ quá phức tạp hoặc tốn nhiều thời gian để giải quyết.

Những khả năng đó quan trọng vượt ra ngoài toán học. Nếu một mô hình có thể giữ cho một lập luận phức tạp mạch lạc, kết nối các ý tưởng qua các vùng tri thức xa lạ và tạo ra những công trình vượt qua được sự giám sát của chuyên gia, thì đó cũng là những khả năng hữu ích trong sinh học, vật lý, khoa học vật liệu, kỹ thuật và y học. Và chúng là một phần trong lộ trình dài hạn của chúng tôi hướng tới những nghiên cứu tự động hóa hơn: các hệ thống có thể giúp các nhà khoa học và kỹ sư khám phá nhiều ý tưởng hơn và theo đuổi các câu hỏi kỹ thuật hóc búa hơn.

AI sắp sửa bắt đầu đảm nhận một vai trò rất nghiêm túc trong các phần sáng tạo của nghiên cứu, và quan trọng nhất là trong chính nghiên cứu về AI. Dù tiến bộ này không nằm ngoài dự đoán, nó củng cố thêm tính cấp bách mà chúng tôi cảm nhận được về việc cần phải thấu hiểu giai đoạn phát triển tiếp theo này của AI, những thách thức của việc hiệu chỉnh (aligning) các hệ thống siêu thông minh, và tương lai của sự hợp tác giữa con người và AI.

Tương lai đó vẫn phụ thuộc vào phán đoán của con người. Chuyên môn hóa trở nên có giá trị hơn chứ không phải kém đi. AI có thể giúp tìm kiếm, đề xuất và xác minh. Con người sẽ chọn những bài toán quan trọng, diễn giải các kết quả và quyết định những câu hỏi nào sẽ theo đuổi tiếp theo.

Các đường dẫn tham khảo

[1] https://openai.com/index/model-disproves-discrete-geometry-conjecture/

[2] Will Sawin, An explicit lower bound for the unit distance problem: https://arxiv.org/abs/2605.20579

[3] Noga Alon, Thomas F. Bloom, W. T. Gowers, Daniel Litt, Will Sawin, Arul Shankar, Jacob Tsimerman, Victor Wang, Melanie Matchett Wood Remarks on the disproof of the unit distance conjecture: https://arxiv.org/abs/2605.20695

M	T	W	T	F	S	S
				1	2	3
4	5	6	7	8	9	10
11	12	13	14	15	16	17
18	19	20	21	22	23	24
25	26	27	28	29	30	31