Пожалуйста, используйте этот идентификатор, чтобы цитировать или ссылаться на этот ресурс:
http://hdl.handle.net/123456789/2612
Полная запись метаданных
Поле DC | Значение | Язык |
---|---|---|
dc.contributor.author | Жаксыбаев, Д. О. | - |
dc.date.accessioned | 2023-09-19T10:34:18Z | - |
dc.date.available | 2023-09-19T10:34:18Z | - |
dc.date.issued | 2023 | - |
dc.identifier.uri | http://hdl.handle.net/123456789/2612 | - |
dc.description.abstract | В данной статье мы представляем исследование по повышению точности извлечения ключевых слов для научных текстов на казахском языке, в частности, в области экологии. Мы исследуем эффективность нескольких алгоритмов, включая Kea, WINGNUS, TextRank, MultipartiteRank, LSA, LDA и Word2Vec для извлечения ключевых слов. Наша цель - продемонстрировать, что алгоритм Word2Vec работает лучше других в определении релевантных ключевых слов в научных текстах на казахском языке. Наши результаты показали, что алгоритм Word2Vec превосходит другие алгоритмы по точности, отзыву и F1-score для извлечения ключевых слов в научных текстах по экологии на казахском языке. В частности, алгоритм Word2Vec достиг точности 0,87, recall 0,86 и F1-score 0,86, в то время как второй по эффективности алгоритм (LSA) достиг точности 0,83, recall 0,81 и F1-score 0,81. Мы заметили, что способность Word2Vec улавливать семантические связи между словами и фразами помогла выявить ключевые слова, тесно связанные с основной темой текста. Алгоритмы LSA и LDA также показали многообещающие результаты, но они были не так эффективны, как Word2Vec, в определении релевантных ключевых слов. Эти результаты имеют важное значение для исследователей и практиков в области экологии, работающих с научными текстами на казахском языке, поскольку они могут использовать алгоритм Word2Vec для более точного и эффективного извлечения ключевых слов. Данное исследование также вносит вклад в более широкие исследования по улучшению извлечения ключевых слов в неанглийских языках | ru |
dc.language.iso | ru | ru |
dc.publisher | Ғылым, зерттеулер, білім беру: даму үрдістері: ХХІІІ халықаралық ғылыми-практ. конф. материалдары=Science, research, education: development trends: The materials of the XXIII international scientific and practical conf. =Наука, исследования, образование: тенденции развития: мат. ХХІІІ междунар. науч.-практ. конф. (Уральск, 14 апреля 2023 г.) / ЗКАТУ им. Жангир хана // Ғылым және білім=Наука и образование=Science and education. - 2023. - № 2 (71) : прил. к журналу № 3 | ru |
dc.subject | научный журнал | ru |
dc.subject | конференции | ru |
dc.subject | отечественное издание | ru |
dc.subject | педагогика | ru |
dc.subject | извлечение ключевых слов | ru |
dc.subject | Word2Vec | ru |
dc.subject | тест Фридмана | ru |
dc.subject | обработка естественного языка | ru |
dc.title | Использование различных методов для извлечения и идентификации ключевых слов из научных текстов на казахском языке | ru |
dc.type | Article | ru |
Располагается в коллекциях: | Материалы конференции |
Файлы этого ресурса:
Файл | Описание | Размер | Формат | |
---|---|---|---|---|
НиО 2023 №2-3 (71)_78-85.pdf | 881,46 kB | Просмотреть/Открыть |
Все ресурсы в архиве электронных ресурсов защищены авторским правом, все права сохранены.