.

Czym jest Słowosieć?

Słowosieć jest polskim wordnetem. Można w skrócie powiedzieć, że to z jednej strony: nowoczesny słownik języka polskiego, a z drugiej: baza danych dostarczająca opisu słownictwa dla celów automatycznego przetwarzania języka naturalnego.

nowoczesny, rozbudowany
słownik o strukturze sieci
nowy standar opisu
słownictwa
model zasobu pojęciowego
danego języka
publikacja cyfrowa, która
może być stale ulepszana
wielodziedzinowa
i szczegółowa ontologia
leksykalno-semantyczna
baza danych
opis leksyki użyteczny
dla narzędzi automatycznego
przetwarzania języka

W wordnetach poszczególne znaczenia słów połączone są relacjami opisującymi związki i zależności między nimi. Założenie jest takie, że poprzez wzajemne odniesienia i poprzez zajmowane miejsce w powstałej w ten sposób sieci relacji wyrazy mają “same” się definiować, dostarczając zarówno ludziom korzystającym z takiego słownika, jak i pracującym na nim programom komputerowym użytecznych informacji o znaczeniach.

Jakie to relacje? Na przykład: dobrze znane użytkownikom słowników - synonimia i antonimia, a także hiponimia (pozwalająca połączyć bardziej precyzyjne określenie z jego inną, ogólniejszą nazwą, jak w parze samochód - pojazd), która - w duecie z odwrotną hiperonimią - jest jednym z najważniejszych budulców wordnetowej sieci. Rodzajów relacji używanych w Słowosieci jest obecnie dokładnie 100. Dziś znajdzie się w niej jednak także glosy przypominające hasła z tradycyjnych słowników. Więcej na temat tego, z czego dokładnie składa się Słowosieć, w zakładce “Jak czytać Słowosieć?”.

? DLA KOGO JEST Słowosieć
Dla komputerów

Może być stosowana w programach wykorzystujących elementy automatycznego przetwarzania języka

Dla każdego

Jako nowoczesny słownik może być pomocny dla każdej osoby szukającej porady w dziedzienie słownictwa oraz dla każdego pasjonata językoznastwa

Dla naukowców

Umożliwia wykonywanie badań na meteriale językowym - zwłaszcza ilościowych

W 2022 roku Słowosieć zawierała 190 tys. lematów (ale tylko: rzeczowników, czasowników, przymiotników i przysłówków), prawie 300 tys. znaczeń i ponad 700 tys. relacji pomiędzy wyrazami. Jest obecnie największym wordnetem na świecie, większym nawet niż jej pierwowzór - amerykański Princeton WordNet. Jest także największym słownikiem języka polskiego.

Słowosieć jest także połączona relacjami z Princeton WordNetem. Do tego opisu służy zestaw specjalnych relacji międzyjęzykowych (36 rodzajów), takich jak np. synonimia międzyjęzykowa (kot - cat) czy hiponimia międzyjęzykowa (grzybowa - soup). Na stronie Słowosieci prezentowany jest także zasób Princeton WordNetu wraz z informacjami o polsko-angielskich relacjach, dzięki czemu Słowosieć może służyć również jako słownik polsko-angielski i angielsko-polski.

słownik antonimów słownik synonimów/
wyrazów bliskoznacznych
słownik języka polskiego słowniki tematyczne słownik archaizmów słownik odmian środowiskowych
i regionalnych polskiego
słownik wyrazów nowych leksykony z terminologią wielu dziedzin słownik relacyjny słownik gniazdowy słownik aksjologiczny słownik przypomnień słownik encyklopedyczny słownik idiomów słownik polsko-angielski
i angielsko-polski

Więcej faktów o rozwoju Słowosieci

Słowosieć jest kluczowym zasobem w komputerowym przetwarzaniu języka i badaniach nad sztuczną inteligencją, m.in. znajduje zastosowanie w automatycznych tłumaczeniach Google Translate. Część danych jest również udostępniana przez platformę Open Multilingual WordNet skupiającą 34 wordnety dla różnych języków świata dostępne na otwartej licencji i powiązane wzajemnie poprzez rzutowanie na Princeton WordNet.

prowadzenie dużych badań
ilośćiowych na materiale językowym
generowanie i przekształcanie tekstów analizy wielojęzyczne automatyczna analiza tekstów wsparcie badań psycholingwistycznych wspomaganie diagnozy i leczenie afazji konstrukcja czatbotów określanie wydźwięku tekstu WSD - ujednoznacznienie pojęć badania stylometryczne wspieranie nauczania języków obcycht łumaczenia automatyczne programowanie urządzeń

Przykłady wykorzystania Słowosieci

Polski wordnet jest budowany wspólnym wysiłkiem leksykografów i informatyków z Grupy Technologii Językowych Politechniki Wrocławskiej. Decyzją władz uczelni Słowosieć jest dostępna bezpłatnie do powszechnego (również komercyjnego) użytku w oparciu o licencję wzorowaną na licencji Princeton WordNet. Użytkownicy mogą przeglądać Słowosieć również za pomocą aplikacji mobilnej oraz WordNetLoom-Viewera (aplikacji umożliwiającej podgląd zwizualizowanej siatki znaczeń Słowosieci, w formie grafu), a także pobierać pliki źródłowe. Programiści mają także dostęp do Słowosieci na poziomie usługi sieciowej oraz API.

Prace nad Słowosiecią realizowane są dzięki grantom Ministerstwa Nauki i Szkolnictwa Wyższego i Funduszom Unijnym, a obecnie – w ramach ogólnoeuropejskiej infrastruktury naukowej CLARIN oraz polskiego konsorcjum CLARIN-PL.

Licencja

plWordNet® is unencumbered, and may be used in commercial applications in accordance with the following license agreement. An attorney representing the commercial interest should review this plWordNet license with respect to the intended use. plWordNet License

This license is available as the file LICENSE in any downloaded version of plWordNet.

This software and database are being provided to you, the LICENSEE, by Wrocław University of Technology under the following license. By obtaining, using and/or copying this software and database, you agree that you have read, understood, and will comply with these terms and conditions: permission to use, copy, modify, distribute, and public expose this software and database (including data getting) and its documentation for any purpose and without fee or royalty is hereby granted, provided that you agree to comply with the following copyright notice and statements, including the disclaimer, and that the same appear on ALL copies of the software, database and documentation, including modifications which you make for internal use or for wider distribution.

plWordNet 4.2 © 2020 by Wrocław University of Technology. All rights reserved.

THIS SOFTWARE AND DATABASE IS PROVIDED “AS IS” AND WROCŁAW UNIVERSITY OF TECHNOLOGY MAKES NO REPRESENTATIONS OR WARRANTIES, EXPRESS OR IMPLIED. BY WAY OF EXAMPLE, BUT NOT LIMITATION, WROCŁAW UNIVERSITY OF TECHNOLOGY MAKES NO REPRESENTATIONS OR WARRANTIES OF MERCHANT-ABILITY OR MERCHANT-FITNESS FOR ANY PARTICULAR PURPOSE; NOR DOES WROCŁAW UNIVERSITY OF TECHNOLOGY MAKE ANY REPRESENTATIONS OR WARRANTIES THAT THE USE OF THE LICENSED SOFTWARE, DATABASE OR DOCUMENTATION WILL NOT INFRINGE ANY THIRD PARTY PATENTS, COPYRIGHTS, TRADEMARKS OR OTHER RIGHTS.

The name of Wrocław University of Technology may not be used in advertising or publicity pertaining to distribution of the software, the database or both. Title to copyright in this software, database and any associated documentation shall at all times remain with Wrocław University of Technology, and LICENSEE agrees to preserve this copyright

Cytowanie

Korzystając z zasobów Słowosieci prosimy o uwzględnienie następujących pozycji bibliograficznych:

Dziob, A., Piasecki, M., & Rudnicka, E. (2019). plWordNet 4.1–a Linguistically Motivated, Corpus-based Bilingual Resource. In: Fellbaum, C., Vossen, P., Rudnicka, E., Maziarz, M., & Piasecki, M. (Eds.), Proceedings of the 10th Global WordNet Conference: July 23-27, 2019, Wroclaw (Poland). Wrocław: Oficyna Wydawnicza Politechniki Wrocławskiej, pp. 353--362. (PDF)
@article{art-pwr-temp,
author = 'Christiane Fellbaum, Piek Vossen, Ewa Rudnicka, Marek Maziarz, Maciej Piasecki (red.)',
chapter = 'Oficyna Wydawnicza Politechniki Wrocławskiej',
journal = 'Oficyna Wydawnicza Politechniki Wrocławskiej',
title = 'Proceedings of the Tenth Global Wordnet Conference: July 23-27, 2019, Wrocław (Poland) ',
year = '2019',
isbn = '978-83-7493-108-3',
}
Piasecki, Maciej, Szpakowicz, Stanisław, Bartosz Broda. A Wordnet from the Ground Up. Wroclaw : Oficyna Wydawnicza Politechniki Wroclawskiej, 2009. (PDF)
@bookplWNBook{null,
author = 'Maciej Piasecki and Stan Szpakowicz and Bartosz Broda',
publisher = 'Oficyna Wydawnicza Politechniki Wroclawskiej',
title = 'A Wordnet from the Ground Up',
year = '2009',
url = 'http://www.dbc.wroc.pl/Content/4220/Piasecki_Wordnet.pdf',
}

Statystyki

Zestawienie statystyk Słowosieci