Điều sản xuất “lò”: Công cụ đối phó?

Tintho

6

24/01/2024

MTĐT – Thứ Tư, ngày 24 tháng 1 năm 2024 08:27 (GMT+7)

Theo dõi MTĐT bên trên

Để đối phó với “xưởng sản xuất bài viết” – các nhà xuất bản đang sử dụng một số công cụ xét duyệt bài viết cũng như thắt chặt các quy định về đạo đức xuất bản.

Nhưng liệu có đủ để loại bỏ hoặc thu hẹp “mô hình kinh doanh” mới xuất hiện trong ngành xuất bản?

Sàng lọc bài viết: Công cụ kết hợp tự động “thủ công”

Khi nhà tâm lý học thần kinh Bernhard Sabel, tổng biên tập của Tạp chí Thần kinh học phục hồi và khoa học thần kinh Sử dụng công cụ kiểm tra khiếu nại giả, anh ấy đã bị sốc. Sau khi sàng lọc khoảng 5.000 bài báo, ước tính có tới 34% bài báo về khoa học thần kinh xuất bản năm 2020 có khả năng là bịa đặt hoặc đạo văn; Đối với các ấn phẩm y khoa, con số này là 24%. Cả hai con số mà ông và các đồng nghiệp đã báo cáo trong bản in trước trên cơ sở dữ liệu medRxiv, được đăng vào ngày 8 tháng 5, đều cao hơn nhiều so với mức họ tính toán cho năm 2010 – và cao hơn nhiều so với mức cơ bản. Cơ sở 2% được ước tính trong báo cáo của nhóm nhà xuất bản năm 2022.

Sabel nói: “Nó giống như “ai đó nói với bạn rằng 30% những gì bạn ăn là độc hại”.

Phát hiện này xác nhận điều mà bấy lâu nay vẫn nghi ngờ: Các tạp chí đang tràn ngập các bản thảo khoa học từ “xưởng sản xuất bài viết” – nơi các nhà nghiên cứu trả tiền để mua những bài báo giả mạo hoặc gây hiểu lầm. nghi ngờ về tác giả. Dorothy Bishop, nhà tâm lý học tại Đại học Oxford, người nghiên cứu các hoạt động xuất bản gian lận, cho biết: “Những trò lừa đảo này đã kiếm bộn tiền bằng cách tấn công một hệ thống không biết cách đối phó với nó”. vấn đề này”. Một thông báo ngày 2 tháng 5 từ nhà xuất bản Hindawi đã nhấn mạnh mối đe dọa này: Họ đóng cửa bốn tạp chí mà họ phát hiện đã bị “xâm phạm nặng nề” bởi các bài báo từ các nhà xuất bản.

Công cụ của Sabel chỉ dựa trên hai số liệu – tác giả sử dụng địa chỉ email cá nhân, không phải cơ quan và những người liệt kê địa chỉ liên kết. Mặc dù đây không phải là giải pháp hoàn hảo vì tỷ lệ lỗi vẫn có thể cao. Các trình phân loại bài viết khác cũng gặp phải vấn đề tương tự.

Tuy nhiên, vẫn còn hy vọng sử dụng các bộ lọc như vậy để phát hiện các bài báo giả mạo có nguy cơ làm hỏng dữ liệu khoa học, gây hiểu lầm cho người đọc và bóp méo các đánh giá khoa học. Sự ra đời gần đây của các công cụ trí tuệ nhân tạo như ChatGPT đã làm tăng thêm những lo ngại này.

Để chống lại rủi ro đó, Hiệp hội Nhà xuất bản Khoa học, Kỹ thuật và Y tế Quốc tế (STM), đại diện cho 120 nhà xuất bản, đang ra mắt Trung tâm Liêm chính để phát triển các công cụ mới. STM không tiết lộ nhiều về phương pháp phát hiện nhằm tránh rò rỉ thông tin về nhà phát hành.

Hai mươi nhà xuất bản – bao gồm cả những nhà xuất bản lớn nhất như Elsevier, Springer Nature và Wiley – đang cùng nhau phát triển các công cụ cho Integrity Hub và 10 nhà xuất bản dự kiến sẽ sử dụng các công cụ kiểm lỗi bài viết. STM cũng dự kiến sẽ thí điểm một công cụ riêng biệt trong năm nay để phát hiện các bản thảo được gửi đồng thời tới nhiều tạp chí, một hành động được đánh giá là phi đạo đức và là dấu hiệu cho thấy những bài báo như vậy có thể đến từ “các nhà xuất bản”. Van Rossum, Giám đốc Integrity Hub cho biết, sự hợp tác quy mô lớn như vậy nhằm cải thiện những hạn chế khi các nhà xuất bản đánh giá riêng lẻ, cũng như chia sẻ các công cụ trong toàn ngành xuất bản.

Và đây không phải là “một quá trình hoàn toàn tự động”, ông nói. Đúng hơn, những công cụ này giống như “bộ lọc thư rác…và bạn vẫn muốn xem qua bộ lọc thư rác của mình hàng tuần” để kiểm tra xem có nội dung nào bị phân loại sai và được gắn thẻ hay không.

STM chưa công bố dữ liệu về tỷ lệ chính xác hoặc phân loại sai vì dự án còn quá mới. Nhưng cố gắng “bắt” càng nhiều hàng giả càng tốt thường sẽ dẫn đến tác dụng không mong muốn là phân loại sai nhiều hơn. Trong một thử nghiệm, công cụ của Sabel đã phân loại chính xác gần 90% bài viết là gian lận hoặc bị rút lại. Tuy nhiên, công cụ này cũng phân loại và đánh dấu tới 44% bài viết thật là “giả mạo” nên kết quả cuối cùng vẫn cần được các chuyên gia đánh giá xem xét.

Việc đánh giá kỹ lưỡng các ấn phẩm đáng ngờ có thể mất rất nhiều thời gian và công sức: Năm 2021, để đánh giá khoảng 3.000 ấn phẩm đáng ngờ, Springer Nature sẽ cần 10 nhân viên. bán thời gian và toàn thời gian (Springer Nature xuất bản khoảng 400.000 bài báo hàng năm.)

Ủy ban phi lợi nhuận về Đạo đức Xuất bản cho biết các nhà xuất bản có thể quyết định từ chối hoặc rút lại các bài báo bị nghi ngờ đến từ các nhà máy xuất bản.

Nó có thực sự hiệu quả không?

Nhưng cũng có ý kiến băn khoăn liệu các tạp chí có thể xem xét và đưa ra giải pháp siết chặt thực sự hiệu quả để chống lại “mô hình kinh doanh” của các “lò sản xuất” hay không. Bởi vì ngày nay có một thực tế là các mô hình xuất bản truy cập mở vàng – tức là tính phí từ tác giả để mở quyền đọc miễn phí ngay khi được xuất bản – có động cơ tài chính để xuất bản nhiều bài báo hơn chứ không phải để thắt chặt chúng. Jennifer Byrne, tại Đại học Sydney, người đã nghiên cứu cách các nhà máy giấy chỉnh sửa dữ liệu di truyền ung thư, cho biết có “xung đột lợi ích rất lớn” liên quan đến các nhà máy giấy.

Mặt khác, áp lực “công bố hoặc chết” mà các cơ quan nghiên cứu đặt lên các nhà khoa học cũng là một yếu tố ảnh hưởng. Van Rossum cho biết: “Chúng tôi đang nghĩ đến việc hợp tác với các cơ quan nghiên cứu để tìm cách loại bỏ một số động cơ có thể gây ra những tác động bất lợi này”. Áp lực xuất bản như vậy có thể đẩy nhiều người không có kinh nghiệm nghiên cứu vào “nhà máy”, đó là lý do tại sao việc đưa một tác giả có liên kết có thể là một dấu hiệu cần kiểm tra.

Byrne cho biết các nhà xuất bản cũng nên tìm kiếm thêm sự hỗ trợ từ bên ngoài để cải thiện các công cụ kiểm lỗi bài viết. Cô nói: “Khi các công cụ được phát triển sau cánh cửa đóng kín, không ai có thể phân tích hoặc điều tra cách thức hoạt động của các công cụ đó. Bà nói thêm, sự hợp tác công khai, cởi mở hơn có thể sẽ hợp nhất các công cụ kiểm tra bài viết nhanh hơn mức mà các nhà sản xuất bài viết có thể theo kịp.

Nhưng chúng ta cũng có thể hy vọng vào một số tiền lệ: Việc dán nhãn các tạp chí bị nghi ngờ là mục tiêu tiềm năng của các nhà sản xuất bài báo cũng sẽ có hiệu quả. Đây là điều mà Viện Hàn lâm Khoa học Trung Quốc (CAS) đã làm – lập danh sách công khai các tạp chí bị nghi ngờ xuất bản các bài báo từ các nhà máy. Công ty của Adam Day đã phát triển và sử dụng công cụ Papermill Alarm để kiểm tra các bài báo và nhận thấy rằng trước danh sách CAS, các bài báo có vấn đề chiếm phần lớn nội dung của một số tạp chí; nhưng kể từ khi CAS công khai danh sách, tỷ lệ này giảm xuống gần bằng 0 chỉ trong vòng vài tháng. (Papermill Alarm gắn cờ các bài viết có khả năng gian lận dựa trên các mô hình nhận dạng dấu hiệu giấy tờ được gửi từ nhà máy sản xuất; tuy nhiên công ty không tiết lộ cụ thể những dấu hiệu này là gì.)

Tuy nhiên, cũng có những lo ngại rằng các bài báo đến từ các nhà máy sẽ được chuyển hướng đến các tạp chí có tác động thấp hơn và các tạp chí này sẽ có ít nguồn lực hơn để phát hiện các bài báo giả. Nhưng vẫn còn hy vọng – nếu nhiều tạp chí cùng hành động, khả năng tồn tại của toàn bộ các nhà máy này có thể bị thu hẹp.

https://connect.facebook.net/vi_VN/sdk.js#xfbml=1&version=v8.0&appId=377021983322274&autoLogAppEvents=1
Source link

MTĐT – Thứ Tư, ngày 24 tháng 1 năm 2024 08:27 (GMT+7)

Theo dõi MTĐT bên trên

Để đối phó với “xưởng sản xuất bài viết” – các nhà xuất bản đang sử dụng một số công cụ xét duyệt bài viết cũng như thắt chặt các quy định về đạo đức xuất bản.

Nhưng liệu có đủ để loại bỏ hoặc thu hẹp “mô hình kinh doanh” mới xuất hiện trong ngành xuất bản?

Sàng lọc bài viết: Công cụ kết hợp tự động “thủ công”

Khi nhà tâm lý học thần kinh Bernhard Sabel, tổng biên tập của Tạp chí Thần kinh học phục hồi và khoa học thần kinh Sử dụng công cụ kiểm tra khiếu nại giả, anh ấy đã bị sốc. Sau khi sàng lọc khoảng 5.000 bài báo, ước tính có tới 34% bài báo về khoa học thần kinh xuất bản năm 2020 có khả năng là bịa đặt hoặc đạo văn; Đối với các ấn phẩm y khoa, con số này là 24%. Cả hai con số mà ông và các đồng nghiệp đã báo cáo trong bản in trước trên cơ sở dữ liệu medRxiv, được đăng vào ngày 8 tháng 5, đều cao hơn nhiều so với mức họ tính toán cho năm 2010 – và cao hơn nhiều so với mức cơ bản. Cơ sở 2% được ước tính trong báo cáo của nhóm nhà xuất bản năm 2022.

Sabel nói: “Nó giống như “ai đó nói với bạn rằng 30% những gì bạn ăn là độc hại”.

Phát hiện này xác nhận điều mà bấy lâu nay vẫn nghi ngờ: Các tạp chí đang tràn ngập các bản thảo khoa học từ “xưởng sản xuất bài viết” – nơi các nhà nghiên cứu trả tiền để mua những bài báo giả mạo hoặc gây hiểu lầm. nghi ngờ về tác giả. Dorothy Bishop, nhà tâm lý học tại Đại học Oxford, người nghiên cứu các hoạt động xuất bản gian lận, cho biết: “Những trò lừa đảo này đã kiếm bộn tiền bằng cách tấn công một hệ thống không biết cách đối phó với nó”. vấn đề này”. Một thông báo ngày 2 tháng 5 từ nhà xuất bản Hindawi đã nhấn mạnh mối đe dọa này: Họ đóng cửa bốn tạp chí mà họ phát hiện đã bị “xâm phạm nặng nề” bởi các bài báo từ các nhà xuất bản.

Công cụ của Sabel chỉ dựa trên hai số liệu – tác giả sử dụng địa chỉ email cá nhân, không phải cơ quan và những người liệt kê địa chỉ liên kết. Mặc dù đây không phải là giải pháp hoàn hảo vì tỷ lệ lỗi vẫn có thể cao. Các trình phân loại bài viết khác cũng gặp phải vấn đề tương tự.

Tuy nhiên, vẫn còn hy vọng sử dụng các bộ lọc như vậy để phát hiện các bài báo giả mạo có nguy cơ làm hỏng dữ liệu khoa học, gây hiểu lầm cho người đọc và bóp méo các đánh giá khoa học. Sự ra đời gần đây của các công cụ trí tuệ nhân tạo như ChatGPT đã làm tăng thêm những lo ngại này.

Để chống lại rủi ro đó, Hiệp hội Nhà xuất bản Khoa học, Kỹ thuật và Y tế Quốc tế (STM), đại diện cho 120 nhà xuất bản, đang ra mắt Trung tâm Liêm chính để phát triển các công cụ mới. STM không tiết lộ nhiều về phương pháp phát hiện nhằm tránh rò rỉ thông tin về nhà phát hành.

Hai mươi nhà xuất bản – bao gồm cả những nhà xuất bản lớn nhất như Elsevier, Springer Nature và Wiley – đang cùng nhau phát triển các công cụ cho Integrity Hub và 10 nhà xuất bản dự kiến sẽ sử dụng các công cụ kiểm lỗi bài viết. STM cũng dự kiến sẽ thí điểm một công cụ riêng biệt trong năm nay để phát hiện các bản thảo được gửi đồng thời tới nhiều tạp chí, một hành động được đánh giá là phi đạo đức và là dấu hiệu cho thấy những bài báo như vậy có thể đến từ “các nhà xuất bản”. Van Rossum, Giám đốc Integrity Hub cho biết, sự hợp tác quy mô lớn như vậy nhằm cải thiện những hạn chế khi các nhà xuất bản đánh giá riêng lẻ, cũng như chia sẻ các công cụ trong toàn ngành xuất bản.

Và đây không phải là “một quá trình hoàn toàn tự động”, ông nói. Đúng hơn, những công cụ này giống như “bộ lọc thư rác…và bạn vẫn muốn xem qua bộ lọc thư rác của mình hàng tuần” để kiểm tra xem có nội dung nào bị phân loại sai và được gắn thẻ hay không.

STM chưa công bố dữ liệu về tỷ lệ chính xác hoặc phân loại sai vì dự án còn quá mới. Nhưng cố gắng “bắt” càng nhiều hàng giả càng tốt thường sẽ dẫn đến tác dụng không mong muốn là phân loại sai nhiều hơn. Trong một thử nghiệm, công cụ của Sabel đã phân loại chính xác gần 90% bài viết là gian lận hoặc bị rút lại. Tuy nhiên, công cụ này cũng phân loại và đánh dấu tới 44% bài viết thật là “giả mạo” nên kết quả cuối cùng vẫn cần được các chuyên gia đánh giá xem xét.

Việc đánh giá kỹ lưỡng các ấn phẩm đáng ngờ có thể mất rất nhiều thời gian và công sức: Năm 2021, để đánh giá khoảng 3.000 ấn phẩm đáng ngờ, Springer Nature sẽ cần 10 nhân viên. bán thời gian và toàn thời gian (Springer Nature xuất bản khoảng 400.000 bài báo hàng năm.)

Ủy ban phi lợi nhuận về Đạo đức Xuất bản cho biết các nhà xuất bản có thể quyết định từ chối hoặc rút lại các bài báo bị nghi ngờ đến từ các nhà máy xuất bản.

Nó có thực sự hiệu quả không?

Nhưng cũng có ý kiến băn khoăn liệu các tạp chí có thể xem xét và đưa ra giải pháp siết chặt thực sự hiệu quả để chống lại “mô hình kinh doanh” của các “lò sản xuất” hay không. Bởi vì ngày nay có một thực tế là các mô hình xuất bản truy cập mở vàng – tức là tính phí từ tác giả để mở quyền đọc miễn phí ngay khi được xuất bản – có động cơ tài chính để xuất bản nhiều bài báo hơn chứ không phải để thắt chặt chúng. Jennifer Byrne, tại Đại học Sydney, người đã nghiên cứu cách các nhà máy giấy chỉnh sửa dữ liệu di truyền ung thư, cho biết có “xung đột lợi ích rất lớn” liên quan đến các nhà máy giấy.

Mặt khác, áp lực “công bố hoặc chết” mà các cơ quan nghiên cứu đặt lên các nhà khoa học cũng là một yếu tố ảnh hưởng. Van Rossum cho biết: “Chúng tôi đang nghĩ đến việc hợp tác với các cơ quan nghiên cứu để tìm cách loại bỏ một số động cơ có thể gây ra những tác động bất lợi này”. Áp lực xuất bản như vậy có thể đẩy nhiều người không có kinh nghiệm nghiên cứu vào “nhà máy”, đó là lý do tại sao việc đưa một tác giả có liên kết có thể là một dấu hiệu cần kiểm tra.

Byrne cho biết các nhà xuất bản cũng nên tìm kiếm thêm sự hỗ trợ từ bên ngoài để cải thiện các công cụ kiểm lỗi bài viết. Cô nói: “Khi các công cụ được phát triển sau cánh cửa đóng kín, không ai có thể phân tích hoặc điều tra cách thức hoạt động của các công cụ đó. Bà nói thêm, sự hợp tác công khai, cởi mở hơn có thể sẽ hợp nhất các công cụ kiểm tra bài viết nhanh hơn mức mà các nhà sản xuất bài viết có thể theo kịp.

Nhưng chúng ta cũng có thể hy vọng vào một số tiền lệ: Việc dán nhãn các tạp chí bị nghi ngờ là mục tiêu tiềm năng của các nhà sản xuất bài báo cũng sẽ có hiệu quả. Đây là điều mà Viện Hàn lâm Khoa học Trung Quốc (CAS) đã làm – lập danh sách công khai các tạp chí bị nghi ngờ xuất bản các bài báo từ các nhà máy. Công ty của Adam Day đã phát triển và sử dụng công cụ Papermill Alarm để kiểm tra các bài báo và nhận thấy rằng trước danh sách CAS, các bài báo có vấn đề chiếm phần lớn nội dung của một số tạp chí; nhưng kể từ khi CAS công khai danh sách, tỷ lệ này giảm xuống gần bằng 0 chỉ trong vòng vài tháng. (Papermill Alarm gắn cờ các bài viết có khả năng gian lận dựa trên các mô hình nhận dạng dấu hiệu giấy tờ được gửi từ nhà máy sản xuất; tuy nhiên công ty không tiết lộ cụ thể những dấu hiệu này là gì.)

Tuy nhiên, cũng có những lo ngại rằng các bài báo đến từ các nhà máy sẽ được chuyển hướng đến các tạp chí có tác động thấp hơn và các tạp chí này sẽ có ít nguồn lực hơn để phát hiện các bài báo giả. Nhưng vẫn còn hy vọng – nếu nhiều tạp chí cùng hành động, khả năng tồn tại của toàn bộ các nhà máy này có thể bị thu hẹp.

https://connect.facebook.net/vi_VN/sdk.js#xfbml=1&version=v8.0&appId=377021983322274&autoLogAppEvents=1
Source link