nl:WikiconNL 2024, 18 травня

Роль енциклопедій

ред.

Мірко Шефер (Mirko Schäfer), Утрехтський університет

Перші енциклопедії XVII століття мали ті самі ідеї, що й Вікіпедія — демократизація доступу до знань.

Ми недооцінюємо, наскільки Вікіпедія виділяється на тлі все більшої комерціалізації, масового збору інформації про користувачів та клікбейту.

Одна з головних проблем — помилки та системні відхилення в самих базах знань, на яких базується Вікіпедія.

Інший ризик — швидке поширення помилок штучними інтелектами (ChatGPT або Siri знаходять помилкову інформацію та тиражують). Наприклад, повідомлення про смерть Стена Лі або класифікація Омара Хадра як канадського солдата. Причина була в помилкових зв'язках, наприклад, Google Knowledge Graph. Загалом спільнота ШІ має великі проблеми з неправильно підписаними наборами даних.

Системне відхилення: на Вікіданих серед місць смерті першим іде Париж, другим — концентраційний табір Терезієнштадт, третя Москва. Це суміш відхилення через інтерес (interest bias) та відхилення через доступність даних (availability bias). Залишається проблема повноти даних: коли можна сказати, що ми добре покрили тему?

Розробили інструмент BOLD Profiler https://egordmitriev.dev/BOLD/ для аналізу графів знань.

Enshittyfication (термін Корі Докторова): якщо платформа надає перевагу доходу над досвідом користувачів (user experience), якість контенту стає все більш лайняною.

Співставний тренд — збільшується кількість статей, які написані через ChatGPT, у тому числі наукових статей, які проходять до Google Scholar, або книг, які продаються на Амазоні, або ілюстрацій, згенерованих невідомо через що.

Проблеми ШІ:

  • фейкова інформація, низької якості
  • збільшення нерівності (наприклад, ШІ може рекомендувати те, що фірма хоче вам продати, а не те, що вам справді треба)
  • грабування (plundering) інформації у відкритому доступі / суспільному надбанні
  • підрив довіри до інформації

Рішення:

  • демістифікація (пояснення екосистеми знань: якщо ввести в пошук картинок «AI», будуть дурні картинки роботів)
  • контекстуалізація
  • engagement
  • регуляція
  • позиціонування.

При цьому ШІ корисний і для вікіпедистів:

  • ASReview для систематичних оглядів
  • DeepL для перекладів

Але все це потребує підготовки, щоб люди знали обмеження моделей ШІ.

Free Software Foundation Europe

ред.

Андре Окерс (André Ockers)

Європейська організація з офісом у Берліні та місцевими групами.

Public money = public code: кампанія для збільшення вільного програмного забезпечення за грома

Адвокація політик, зокрема, DMA, нейтральність пристроїв (device neutrality).

Юридична підтримка, зокрема, Reuse для того, щоб файли та їхні ліцензії були зрозумілими для людей та для комп'ютерів, Zooom — ініціатива Єврокомісії.

Router Freedom — одна з головних кампаній, за те, щоб люди мали змогу обирати роутери, контролювати їх та ПЗ на них. Інакше є проблема з контролем за тим, що відбувається з вашим пристроєм та даними на них.

Як уникнути того, щоб вільне ПЗ ставало корпоративним, як-от Android? Оскільки вільне ПЗ має всі ці свободи, то люди можуть на його основі запустити свій проєкт. Але не можна змінити ліцензію ретроспективно.

URAA та суспільне надбання

ред.

Маартен Зейнстра (Maarten Zeinstra), голова Open Nederlands. Слайди: https://docs.google.com/presentation/d/1pq2drnj-YiWcNssFHryL_0ZSy-RnZBBGr5-7zMAK1Lg/edit#slide=id.p

Проблема того, що є твори, які є суспільним надбанням у Нідерландах, але не можуть бути на Вікісховищі через URAA.

У Європі АП діє 70 років після смерті (тобто померлі в 1953 і пізніше), якщо псевдонім, анонім або організація — 70 років після публікації.

Але АП національне, тобто діє в кожній країні окремо. За той самий твір ви отримуєте АП в Нідерландах, Бельгії, Україні тощо — але всі на різних умовах. Є гармонізація завдяки Бернській конвенції (мінімум 50 років, але не більше за термін захисту в країні походження).

Проблема: США підписали Бернську конвенцію пізно (1988) та з дивними обмеженнями. У США до URAA (1996) були формальності: треба було зареєструвати АП, і цю норму треба було скасувати. Наслідком стало відновлення АП, передусім на твори іноземних творів, які не були на той час в СН країні походження.

Правила США:

  • опубліковано з 1 січня 1978: 70 років після смерті автора
  • до 1978: 75 років до публікації.

Красива діаграма в слайдах (з інтерактивною версію): https://lawflow.org/uraa-interactions-for-wikimedia-commons/

Питання того, що вважати публікацією. Наприклад, саме через це не в СН щоденник Анни Франк (бо він побачив світ надто пізно). У Нідерландах це будь-що за межами сімейного кола.

Вікіпедія та ШІ

ред.

Мар'яна Груббен (Marian Grubben, 30 років досвіду в ЄС), Гай Кранен (Hay Kranen, User:Husky, вікімедієць з 2005, перший вікімедієць у резиденції), Сірус Кавгерсі (Sirous Kavehercy, 25 років у телекомунікаціях і вільних знаннях).

Теми дискусій:

  1. Вікіпедія як джерело даних для ШІ (ШІ треба багато даних для навчання, Вікіпедія є ідеальним джерелом). Обговорювали, чи варто брати гроші за використання Вікіпедії для тренування ШІ (і проблема ліцензії CA, яку складно прилаштувати до ШІ)
  2. ШІ-альтернативи інтерфейсу Вікіпедії (більше людей споживають контент Вікіпедії через інтерфейс пошуковиків або чатботів, а не напряму). Ідея: розробити вікіпедійний чатбот на кшталт WikipediaGPT (але якщо тренувати лише на Вікіпедії, це буде погана якість контексту).
  3. ШІ-інструменти для поліпшення Вікіпедії. Дві основні ідеї з AI Sauna: підписи до зображень, візуальна ідентифікація людей на світлинах. Довге обговорення, чи варто дозволяти ШІ писати статті до Вікіпедії. Також обговорення потенціалу ШІ для перекладу статей між мовами: найбільше інтересу до порівняння статей між мовами. В обговоренні інструментів ШІ для існуючих статей перемагає підсумування статей простішою / коротшою / доступною для дітей мовою.
  4. ШІ-проєкти як конкуренти для Вікіпедії. Чи можна довіряти інформації, згенерованій без участі людей?
  5. Уроки Вікіпедії для розвитку ШІ. Головна ідея: на відміну від Вікіпедії, невідомо, звідки моделі ШІ беруть дані.

Мотивації редагування Вікіпедії

ред.

Даріуш Ємельняк (Dariusz Jemielniak)

Вікіпедія — не sharing economy.

  • Sharing: зазвичай застовується до капіталістичних платформ (Uber, Airbnb), де sharing важливе. Якщо застосовувати до 9gag або Tumblr, то там важливе не sharing, а interaction.
  • Economy: це не економіка, бо найкращі речі зазвичай безкоштовні. Ми хочемо співпрацювати з незнайомими людьми, і це економічно невигідно.

Саме тому Даріуш називає це collaborative society.

  • Капіталістичні платформи з користувачами прибуткової мотивації: Uber, Airbnb
  • Капіталістичні платформи з користувачами неприбуткової мотивації: TripAdvisor, Couchsurfing
  • Кооперативні платформи з користувачами прибуткової мотивації: timebanks, продовольчі кооперативи
  • Кооперативні платформи з користувачами неприбуткової мотивації: онлайн-активізм, Вікіпедія, Linux. (Peer production)

Вікіпедія — найбільший соціальний рух на Землі, і за збігом обставин також енциклопедія. Люди витрачають значно більше часу на обговорення, ніж на написання оригінальних статей. Найдовші обговорення Вікіпедії — сотні тисяч слів.

Чому люди це роблять? Мабуть, через правила Вікіпедії (ВП:НО, ВП:ПДН, перевірність замість пошуку правди, конфлікт переходить у співпрацю, пласка ієрархія — хоча є неформальна ієрархія, зрештою, ВП:ІУП). Це робить дискусії довшими, але не відлякує людей. І саме через це статті на контроверсійні теми (Гомеопатія, Джордж Буш, Саєнтологія) такі довгі, бо найкращий спосіб змагання — робити статті кращими.

Закон Годвіна не працює на практиці: на основі аналізу Reddit порівняння з Гітлером не припиняє дискусії. Ймовірність самого порівняння дещо вища на початку дискусії, а потім спадає. Ймовірно, через те, що поріг входу до дискусії зростає.

Такий самий приклад поведінки у конфлікти Gdańsk/Danzig в англійській Вікіпедії: сформувалася група найактивніших людей, які сформували певні принципи співіснування і продовжили існувати за таким принципом. У підсумку всім набридло, всі погодилися вирішити проблему голосуванням, і обидві сторони захищали голосування, бо повернення до конфлікту було б ще гіршим за поганий результат.

Дискусії у Вікіпедії стають цікавими, бо зустрічаються позиції, які зазвичай не перетинаються (наприклад, сучасна американська політика з європейською медієвістикою в en:Legitimate rape).

Управління рухом (movement governance):

  1. Експеримент, схвалений 5 місяців адмінами та Фондом Вікімедіа: банер про проєкт зняли через опір спільноти за кілька годин після початку. Наслідком стало обговорення того, кому ж «належать» банери.
  2. Протест блекауту італійської Вікіпедії в 2011 року. Фонд дізнався про подію в день протесту, але він був аж ніяк не готовий до інтересу медіа. Причина — сильне відчуття користувачів, що проєкт належить їм (і це є, наприклад, у Reddit, але нема в Google Maps — цілеспрямовано, щоб люди не почали впливати на Google Maps).
  3. Опитування про фільтрування зображень. Мова про зображення насилля, сексуальних актів тощо. Спільноти підтримали це, Фонд теж. Але проєкт поховали після опору спільноти.

Підсумок: управління Вікіпедії консенсусом загалом непогане рішення, але має багато побічних ефектів.

Баланс у Вікіпедії: вона не ідеальна для всіх, але достатньо прийнятна для всіх (консерваторів і лібералів, лівих і правих), щоб вони не робили свій форк / відгалуження.

Ідея Даріуша: Вікімедійна академія лідерства для майбутніх адмінів, правлінців. Почати можна з Ради повірених Фонду.

Нові тренди: феномен дуже досвідчених редакторів англійської Вікіпедії, яким пробачають значно більше середнього. І з іншого боку, спільнота не цінує людей, які пишуть вибрані статті — які важливіші для тривалого існування спільноти, ніж людина, яка виправляє 1000 ком.