Khi các mô hình tạo ra các kết quả nghe hợp lý nhưng thực tế lại sai lệch, điều này đặt ra một câu hỏi cơ bản: Liệu các hình phạt RLHF có thể thực sự vượt qua các cấu trúc diễn giải cốt lõi mà chúng ta đang cố gắng bảo tồn không? Câu đố thực sự ở đây có thể là liệu chúng ta có đang theo đuổi các mục tiêu tối ưu hóa sai lầm hoàn toàn hay không. Vậy đây là góc nhìn thực tế—liệu các hàm mất mát duy trì tính toàn vẹn của khung xương có thực sự khả thi trong mô hình huấn luyện hiện tại hay chúng ta đang gặp phải các giới hạn cứng mà chưa nhận thức đầy đủ? Cần suy nghĩ kỹ về cơ chế trước khi mở rộng quy mô hơn.
Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
7 thích
Phần thưởng
7
4
Đăng lại
Retweed
Bình luận
0/400
TokenAlchemist
· 5giờ trước
nah this is just the classic "chúng tôi xây dựng hệ thống sai từ đầu" vấn đề được khoác áo toán học sang trọng. RLHF về cơ bản đang chống lại những gì mô hình thực sự đã học—giống như cố gắng khai thác alpha từ một bề mặt arbitrage bị hỏng. Vectơ không hiệu quả thực sự ở đây là giả vờ rằng hàm mất mát có thể vá lỗi lười biếng trong kiến trúc. chúng tôi đang tối ưu hóa các chuyển đổi trạng thái sai fr
Xem bản gốcTrả lời0
VitalikFanboy42
· 5giờ trước
Thành thật mà nói, bộ RLHF đó hoàn toàn không thể giải quyết được vấn đề cốt lõi. Chúng ta có thể đã bắt đầu tối ưu hóa sai thứ từ đầu rồi.
Xem bản gốcTrả lời0
CompoundPersonality
· 5giờ trước
rlhf này thật sự là như bắt cóc bỏ dĩa, muốn sửa vấn đề ảo giác nhưng lại làm mất đi một số khả năng của mô hình, cảm giác như mất phương hướng.
Khi các mô hình tạo ra các kết quả nghe hợp lý nhưng thực tế lại sai lệch, điều này đặt ra một câu hỏi cơ bản: Liệu các hình phạt RLHF có thể thực sự vượt qua các cấu trúc diễn giải cốt lõi mà chúng ta đang cố gắng bảo tồn không? Câu đố thực sự ở đây có thể là liệu chúng ta có đang theo đuổi các mục tiêu tối ưu hóa sai lầm hoàn toàn hay không. Vậy đây là góc nhìn thực tế—liệu các hàm mất mát duy trì tính toàn vẹn của khung xương có thực sự khả thi trong mô hình huấn luyện hiện tại hay chúng ta đang gặp phải các giới hạn cứng mà chưa nhận thức đầy đủ? Cần suy nghĩ kỹ về cơ chế trước khi mở rộng quy mô hơn.