Tehtävälista
Tässä projektissa on vielä paljon tekemistä ja parannettavaa. Tällaista on ainakin:
-
.whl-julkaisun tuottaminen (parhaillaan: CI) -
Dokumentaatio (käyttäjän näkökulmasta) -
PyPi -
Trie-tiedoston suomentaminen -
Järkevien virheviestien laatiminen -
Testit -
Dokumentaatio (arkkitehtonisesti) -
Toisen tietorakenteen kokeileminen (suffiksijärjestetty lista, sanat jotenkin kevyesti pakattu. esimerkiksi BPE tai jokin frekvensseihin perustuva; mahdollisesti pituusämpäreittäin tms.) -
Arvaimen älykkäämmäksi tekeminen (esim. syväoppimista) -
Vaihtoehtoisesti: jollakin korpuksella sanojen todennäköisyyksiin perustuva painotus tilastoarvauksissa? Tekisikö paremmaksi vai huonommaksi?
-
-
Rajapintaan mahdollisuus taivuttaa mallilla sijan nimen sijaan -
Interpolointi: voiko Pythonissa määritellä omia interpolointeja f-merkkijonoille? Ainakin omat formatoijat tapahtuvat yllättävän nätisti: https://stackoverflow.com/questions/57570026/how-to-provide-custom-formatting-from-format-string. Ilmeisesti itse f-merkkijonoihin vastaavan rakentaminen on vaikeaa: https://stackoverflow.com/questions/55876683/hook-into-the-builtin-python-f-string-format-machinery.
Bugeja
-
Arvain ei käytä arvaa_viimeinen_komponentti -metodia pohtiessaan sointuluokkaa. Yleisesti tästä voisi tehdä jonkun vähän enemmän tilakonemaisen; generoidaan kaikki mahdolliset yhdyssanat ja tilastoidaan tms. -
Nimitaivutuksissa tietyt t-loppuiset nimet tulkitaan monikoiksi.
Tämän koodivaraston ulkopuolella:
-
Renpy-ratkaisu, joka käyttäytyy nätisti; sisältää ainakin .zip-muodossa olevan arkiston käyttäjille, jotka eivät säännöllisesti käytä Pythonin pakettiratkaisuja. Ideaalisesti liittyisi jokin elegantti tapa yhdistyä Renpyyn itseensä, toivottavasti peräti sellainen, jolle saisi Renpy-kehittäjien siunauksen. -
Rust-versio (Kirjastoksi ja WASM-käännettäväksi): pitäisi syntyä nätin nostd jos tietorakenteeksi saa jotain sopivan säännöllistä. -
Rust-versio cargoon / c-rajapinta.
Edited by Théo Friberg