Решение на Изберете си проект от Десислава Говедарска

Обратно към всички решения

Към профила на Десислава Говедарска

Код

'''
Здравейте, след дълго чудене изгенерирах цели 3 идеи за проект (понеже не гарантирам за качеството, наблегнах на количеството). Надявам се Вие да ме насочите коя е подходяща. :)
Идея 0: Онлайн Dixit
Какво е Dixit? -> цък: http://en.wikipedia.org/wiki/Dixit_%28card_game%29
Система предназначена за фенове на бордовите игри, които си нямат приятели. След log on в системата (мисля да няма регистрирани потребители, просто всеки ще си избира прякор в началото на сесията), потребителят ще бъде свързван с 5ма други в стая и ще играят Dixit. Разбира се системата ще се грижи за flow-а на играта: раздава картите, смята точките и т.н.
Идея 1: Разпознаване на текстове на автор
Идеята ми е да направя система, която по даден текст да може да разпознае кой е авторът му. Разбира се, за тази цел тя вече трябва да познава достатъчно други текстове на съответния автор.
Disclaimer 1: Нищо не разбирам от NLP.
Disclaimer 2: Нищо не разбирам от Machine Learning.
Не съм се задълбавала сериозно в темата, но мисля че това: http://www.nltk.org/ би свършило работа за анализа на текстовете, а това http://scikit-learn.org/stable/ за направата на модел, който да "обуча" да разпознава текстовете. Вероятно няма да успея да постигна много голяма успеваемост(see disclaimers 1 & 2), но ако сглобя нещо което да работи дори само със тестови данни, ще съм много доволна. От трите идеи, тази е май е най-интересна и с най-голям шанс за тотален провал. :)
Идея 2: Туул за тестване на Cloud Foundry/Heroku BuildPacks писани на Batch Script
Ок, подобно нещо вече има -> https://github.com/heroku/heroku-buildpack-testrunner, но е базирано на shUnit, т.е. работи само за BuildPacks писани на shell script. Това е напълно окей, но по едно стечение на обстоятелствата ми се наложи да адаптирам (разбирай пренапиша на Batch Script) CF Buildpack за Windows и се оказа, че няма как да си пусна тестовете. Идеята ми е да да напиша подобен туул на Python, за да може да се тестват и Batch Script based Buildpacks.
Надявам се, че съм описала идеите си разбираемо и че ще ми помогнете да избера най-подходящата!
'''

История (1 версия и 2 коментара)

Десислава обнови решението на 26.04.2015 18:58 (преди почти 9 години)

+'''
+Здравейте, след дълго чудене изгенерирах цели 3 идеи за проект (понеже не гарантирам за качеството, наблегнах на количеството). Надявам се Вие да ме насочите коя е подходяща. :)
+
+Идея 0: Онлайн Dixit
+Какво е Dixit? -> цък: http://en.wikipedia.org/wiki/Dixit_%28card_game%29
+
+Система предназначена за фенове на бордовите игри, които си нямат приятели. След log on в системата (мисля да няма регистрирани потребители, просто всеки ще си избира прякор в началото на сесията), потребителят ще бъде свързван с 5ма други в стая и ще играят Dixit. Разбира се системата ще се грижи за flow-а на играта: раздава картите, смята точките и т.н.
+
+Идея 1: Разпознаване на текстове на автор
+Идеята ми е да направя система, която по даден текст да може да разпознае кой е авторът му. Разбира се, за тази цел тя вече трябва да познава достатъчно други текстове на съответния автор.
+Disclaimer 1: Нищо не разбирам от NLP.
+Disclaimer 2: Нищо не разбирам от Machine Learning.
+
+Не съм се задълбавала сериозно в темата, но мисля че това: http://www.nltk.org/ би свършило работа за анализа на текстовете, а това http://scikit-learn.org/stable/ за направата на модел, който да "обуча" да разпознава текстовете. Вероятно няма да успея да постигна много голяма успеваемост(see disclaimers 1 & 2), но ако сглобя нещо което да работи дори само със тестови данни, ще съм много доволна. От трите идеи, тази е май е най-интересна и с най-голям шанс за тотален провал. :)
+
+Идея 2: Туул за тестване на Cloud Foundry/Heroku BuildPacks писани на Batch Script
+
+Ок, подобно нещо вече има -> https://github.com/heroku/heroku-buildpack-testrunner, но е базирано на shUnit, т.е. работи само за BuildPacks писани на shell script. Това е напълно окей, но по едно стечение на обстоятелствата ми се наложи да адаптирам (разбирай пренапиша на Batch Script) CF Buildpack за Windows и се оказа, че няма как да си пусна тестовете. Идеята ми е да да напиша подобен туул на Python, за да може да се тестват и Batch Script based Buildpacks.
+
+Надявам се, че съм описала идеите си разбираемо и че ще ми помогнете да избера най-подходящата!
+'''

Здравей! Съжалявам, че толкова късно отговаряме. И трите ти идеи са хубави, нямам проблем с нито една от тях. Това казано, не съм сигурен, че разбирам много добре какво ще изисква написването на последната - buildpack за batch.

Единствения начин, по който мога да ти помогна е да ти кажа, че ако правиш това, което ти е най - интересно имаш най - голям шанс в крайна сметка да се получи нещо с което се гордееш.

Същевременно - може да греша, но намирането на текст от определен автор не е ли търсене дали текста е от някоя от книгите на автора, за която системата ти знае? Това не е ли обикновено търсене на текст в купчина от други текстове? Или ти ще се опиташ да намираш автора при условие, че нямаш пълна информация за всичките му произведения? Да научиш алгоритъма си да разпознава стила, героите или обстановката на автора? Всъщност добре, много хубава идея е този проект.

Здравей! Да, идеята ми е алгоритъма да разполага с определен брой произведения на автора, които да анализира и да извади статистики, които биха били показателни за стила му (брои използвани синоними, дължина на изречения и т.н. -> вече има библиотека, която прави този синтактичен анализ). По този начин ще "обуча" алгоритъма да разпознава известен брой автори и когато му подам текст с неизвестен автор (текстът не е бил използван в процеса на обучение), ще очаквам от него да разпознае автора. :) Разбира се, едва ли ще постигна 100% успеваемост (бих станала много богата, ако успея :D). Смятам да последвам съвета ти и да се заема с тази идея, защото е най-интересна! Благодаря! :)