Czym jest Słowosieć?
Słowosieć jest polskim wordnetem. Można w skrócie powiedzieć, że to z jednej strony: nowoczesny słownik języka polskiego, a z drugiej: baza danych dostarczająca opisu słownictwa dla celów automatycznego przetwarzania języka naturalnego.
słownik o strukturze sieci nowy standar opisu
słownictwa model zasobu pojęciowego
danego języka publikacja cyfrowa, która
może być stale ulepszana wielodziedzinowa
i szczegółowa ontologia leksykalno-semantyczna
baza danych opis leksyki użyteczny
dla narzędzi automatycznego
przetwarzania języka
W wordnetach poszczególne znaczenia słów połączone są relacjami opisującymi związki i zależności między nimi. Założenie jest takie, że poprzez wzajemne odniesienia i poprzez zajmowane miejsce w powstałej w ten sposób sieci relacji wyrazy mają “same” się definiować, dostarczając zarówno ludziom korzystającym z takiego słownika, jak i pracującym na nim programom komputerowym użytecznych informacji o znaczeniach.
Jakie to relacje? Na przykład: dobrze znane użytkownikom słowników - synonimia i antonimia, a także hiponimia (pozwalająca połączyć bardziej precyzyjne określenie z jego inną, ogólniejszą nazwą, jak w parze samochód - pojazd), która - w duecie z odwrotną hiperonimią - jest jednym z najważniejszych budulców wordnetowej sieci. Rodzajów relacji używanych w Słowosieci jest obecnie dokładnie 100. Dziś znajdzie się w niej jednak także glosy przypominające hasła z tradycyjnych słowników. Więcej na temat tego, z czego dokładnie składa się Słowosieć, w zakładce “Jak czytać Słowosieć?”.
Może być stosowana w programach wykorzystujących elementy automatycznego przetwarzania języka
Jako nowoczesny słownik może być pomocny dla każdej osoby szukającej porady w dziedzienie słownictwa oraz dla każdego pasjonata językoznastwa
Umożliwia wykonywanie badań na meteriale językowym - zwłaszcza ilościowych
W 2022 roku Słowosieć zawierała 190 tys. lematów (ale tylko: rzeczowników, czasowników, przymiotników i przysłówków), prawie 300 tys. znaczeń i ponad 700 tys. relacji pomiędzy wyrazami. Jest obecnie największym wordnetem na świecie, większym nawet niż jej pierwowzór - amerykański Princeton WordNet. Jest także największym słownikiem języka polskiego.
Słowosieć jest także połączona relacjami z Princeton WordNetem. Do tego opisu służy zestaw specjalnych relacji międzyjęzykowych (36 rodzajów), takich jak np. synonimia międzyjęzykowa (kot - cat) czy hiponimia międzyjęzykowa (grzybowa - soup). Na stronie Słowosieci prezentowany jest także zasób Princeton WordNetu wraz z informacjami o polsko-angielskich relacjach, dzięki czemu Słowosieć może służyć również jako słownik polsko-angielski i angielsko-polski.
wyrazów bliskoznacznych słownik języka polskiego słowniki tematyczne słownik archaizmów słownik odmian środowiskowych
i regionalnych polskiego słownik wyrazów nowych leksykony z terminologią wielu dziedzin słownik relacyjny słownik gniazdowy słownik aksjologiczny słownik przypomnień słownik encyklopedyczny słownik idiomów słownik polsko-angielski
i angielsko-polski
Więcej faktów o rozwoju Słowosieci
Słowosieć jest kluczowym zasobem w komputerowym przetwarzaniu języka i badaniach nad sztuczną inteligencją, m.in. znajduje zastosowanie w automatycznych tłumaczeniach Google Translate. Część danych jest również udostępniana przez platformę Open Multilingual WordNet skupiającą 34 wordnety dla różnych języków świata dostępne na otwartej licencji i powiązane wzajemnie poprzez rzutowanie na Princeton WordNet.
ilośćiowych na materiale językowym generowanie i przekształcanie tekstów analizy wielojęzyczne automatyczna analiza tekstów wsparcie badań psycholingwistycznych wspomaganie diagnozy i leczenie afazji konstrukcja czatbotów określanie wydźwięku tekstu WSD - ujednoznacznienie pojęć badania stylometryczne wspieranie nauczania języków obcycht łumaczenia automatyczne programowanie urządzeń
Przykłady wykorzystania Słowosieci
Polski wordnet jest budowany wspólnym wysiłkiem leksykografów i informatyków z Grupy Technologii Językowych Politechniki Wrocławskiej. Decyzją władz uczelni Słowosieć jest dostępna bezpłatnie do powszechnego (również komercyjnego) użytku w oparciu o licencję wzorowaną na licencji Princeton WordNet. Użytkownicy mogą przeglądać Słowosieć również za pomocą aplikacji mobilnej oraz WordNetLoom-Viewera (aplikacji umożliwiającej podgląd zwizualizowanej siatki znaczeń Słowosieci, w formie grafu), a także pobierać pliki źródłowe. Programiści mają także dostęp do Słowosieci na poziomie usługi sieciowej oraz API.
Prace nad Słowosiecią realizowane są dzięki grantom Ministerstwa Nauki i Szkolnictwa Wyższego i Funduszom Unijnym, a obecnie – w ramach ogólnoeuropejskiej infrastruktury naukowej CLARIN oraz polskiego konsorcjum CLARIN-PL.
Licencja
plWordNet® is unencumbered, and may be used in commercial applications in accordance with the following license agreement. An attorney representing the commercial interest should review this plWordNet license with respect to the intended use. plWordNet License
This license is available as the file LICENSE in any downloaded version of plWordNet.
This software and database are being provided to you, the LICENSEE, by Wrocław University of Technology under the following license. By obtaining, using and/or copying this software and database, you agree that you have read, understood, and will comply with these terms and conditions: permission to use, copy, modify, distribute, and public expose this software and database (including data getting) and its documentation for any purpose and without fee or royalty is hereby granted, provided that you agree to comply with the following copyright notice and statements, including the disclaimer, and that the same appear on ALL copies of the software, database and documentation, including modifications which you make for internal use or for wider distribution.
plWordNet 4.2 © 2020 by Wrocław University of Technology. All rights reserved.
THIS SOFTWARE AND DATABASE IS PROVIDED “AS IS” AND WROCŁAW UNIVERSITY OF TECHNOLOGY MAKES NO REPRESENTATIONS OR WARRANTIES, EXPRESS OR IMPLIED. BY WAY OF EXAMPLE, BUT NOT LIMITATION, WROCŁAW UNIVERSITY OF TECHNOLOGY MAKES NO REPRESENTATIONS OR WARRANTIES OF MERCHANT-ABILITY OR MERCHANT-FITNESS FOR ANY PARTICULAR PURPOSE; NOR DOES WROCŁAW UNIVERSITY OF TECHNOLOGY MAKE ANY REPRESENTATIONS OR WARRANTIES THAT THE USE OF THE LICENSED SOFTWARE, DATABASE OR DOCUMENTATION WILL NOT INFRINGE ANY THIRD PARTY PATENTS, COPYRIGHTS, TRADEMARKS OR OTHER RIGHTS.
The name of Wrocław University of Technology may not be used in advertising or publicity pertaining to distribution of the software, the database or both. Title to copyright in this software, database and any associated documentation shall at all times remain with Wrocław University of Technology, and LICENSEE agrees to preserve this copyright
Cytowanie
Korzystając z zasobów Słowosieci prosimy o uwzględnienie następujących pozycji bibliograficznych:
@article{art-pwr-temp, author = 'Christiane Fellbaum, Piek Vossen, Ewa Rudnicka, Marek Maziarz, Maciej Piasecki (red.)', chapter = 'Oficyna Wydawnicza Politechniki Wrocławskiej', journal = 'Oficyna Wydawnicza Politechniki Wrocławskiej', title = 'Proceedings of the Tenth Global Wordnet Conference: July 23-27, 2019, Wrocław (Poland) ', year = '2019', isbn = '978-83-7493-108-3', }
@bookplWNBook{null, author = 'Maciej Piasecki and Stan Szpakowicz and Bartosz Broda', publisher = 'Oficyna Wydawnicza Politechniki Wroclawskiej', title = 'A Wordnet from the Ground Up', year = '2009', url = 'http://www.dbc.wroc.pl/Content/4220/Piasecki_Wordnet.pdf', }
Statystyki
Zestawienie statystyk Słowosieci