PMI25 commited on
Commit
e7b1b6b
·
verified ·
1 Parent(s): 6a011c2

Update README.md

Browse files
Files changed (1) hide show
  1. README.md +62 -37
README.md CHANGED
@@ -1,56 +1,81 @@
1
  ---
2
- title: "Анализатор тональности текста"
3
  emoji: "😊"
4
  colorFrom: "blue"
5
- colorTo: "purple"
6
  sdk: "gradio"
7
- sdk_version: "4.19.2"
8
  app_file: "app.py"
9
  pinned: false
10
  ---
11
 
12
- # 📊 Анализатор тональности текста (Sentiment Analysis)
13
 
14
- ## 📋 Описание задачи
15
 
16
- Это веб-приложение выполняет анализ тональности (сентимент-анализ) текстов на различных языках. Определяет эмоциональную окраску текста: позитивную, негативную или нейтральную.
17
 
18
- ## 🎯 Возможности
 
 
 
19
 
20
- - **Мультимодельный анализ:** 3 предобученные модели на выбор
21
- - **Мультиязычность:** Поддержка русского, английского и других языков
22
- - **Пакетная обработка:** Анализ текстов из TXT и CSV файлов
23
- - **История запросов:** Сохранение последних 10 анализов
24
- - **Метрики качества:** Оценка точности на тестовых данных
25
- - **Примеры:** Готовые примеры для быстрого тестирования
 
 
 
 
 
 
 
26
 
27
- ## 🤖 Выбранные модели
28
 
29
- ### 1. `cointegrated/rubert-tiny-sentiment-balanced`
 
30
  - **Язык:** Русский
31
- - **Классы:** Нейтрал/Позитив/Негатив
32
- - **Преимущества:** Лёгкая, быстрая, оптимизирована для русского языка
33
- - **Размер:** ~47 МБ
34
-
35
- ### 2. `distilbert-base-uncased-finetuned-sst-2-english`
36
- - **Язык:** Английский
37
- - **Классы:** POSITIVE/NEGATIVE
38
- - **Преимущества:** Высокая точность для английских текстов
39
- - **Размер:** ~268 МБ
40
-
41
- ### 3. `nlptown/bert-base-multilingual-uncased-sentiment`
42
- - **Язык:** Мультиязычная
43
- - **Классы:** 1-5 звёзд (5 - самый позитивный)
44
- - **Преимущества:** Поддержка множества языков
45
- - **Размер:** ~668 МБ
46
 
47
- ## 🚀 Быстрый старт
 
 
 
 
 
 
 
48
 
49
- 1. **Введите текст** в текстовое поле
50
- 2. **Выберите модель** из выпадающего списка
51
- 3. **Нажмитенализировать"**
52
- 4. **Получите результат** с тональностью и уверенностью
53
 
54
- ## 📊 Примеры анализа
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
55
 
56
- ### Русский текст:
 
1
  ---
2
+ title: "Sentiment Analyzer RU"
3
  emoji: "😊"
4
  colorFrom: "blue"
5
+ colorTo: "green"
6
  sdk: "gradio"
7
+ sdk_version: "4.12.0"
8
  app_file: "app.py"
9
  pinned: false
10
  ---
11
 
12
+ # Анализатор тональности текста
13
 
14
+ Интерактивное веб-приложение для анализа эмоциональной окраски русскоязычных текстов.
15
 
16
+ ## 🎯 Описание
17
 
18
+ Приложение определяет тональность введенного текста и классифицирует его как:
19
+ - **😊 Позитивный** - положительные эмоции
20
+ - **😞 Негативный** - отрицательные эмоции
21
+ - **😐 Нейтральный** - без выраженной эмоциональной окраски
22
 
23
+ ## 🚀 Быстрый старт
24
+
25
+ 1. **Введите текст** в поле ввода (на русском языке)
26
+ 2. **Нажмите "Анализировать тональность"** или клавишу Enter
27
+ 3. **Получите результат** с оценкой уверенности модели
28
+
29
+ ## 📊 Примеры использования
30
+
31
+ | Входной текст | Результат | Уверенность |
32
+ |--------------|-----------|-------------|
33
+ | "Отличный продукт!" | 😊 ПОЗИТИВНЫЙ | 98% |
34
+ | "Ужасное качество" | 😞 НЕГАТИВНЫЙ | 96% |
35
+ | "Обычный день" | 😐 НЕЙТРАЛЬНЫЙ | 92% |
36
 
37
+ ## 🤖 Технические детали
38
 
39
+ - **Модель:** `cointegrated/rubert-tiny-sentiment-balanced`
40
+ - **Тип задачи:** Анализ тональности (sentiment analysis)
41
  - **Язык:** Русский
42
+ - **Архитектура:** RuBERT-tiny
43
+ - **Классы:** позитив/негатив/нейтрал
 
 
 
 
 
 
 
 
 
 
 
 
 
44
 
45
+ ## ⚙️ Параметры
46
+
47
+ - **Максимальная длина текста:** 1000 символов
48
+ - **Автообрезание:** Да (с уведомлением)
49
+ - **Время обработки:** 0.1-0.5 секунд
50
+ - **Платформа:** CPU-оптимизированная
51
+
52
+ ## 📁 Поддерживаемые форматы
53
 
54
+ - Любой текст на русском языке
55
+ - Короткие сообщения и отзывы
56
+ - Комментарии и рецензии
57
+ - Обращения и feedback
58
 
59
+ ## 🔧 Технологии
60
+
61
+ - **Gradio 4.12.0** - веб-интерфейс
62
+ - **Transformers 4.36.0** - NLP фреймворк
63
+ - **PyTorch 2.1.0** - машинное обучение
64
+ - **Hugging Face Hub** - репозиторий моделей
65
+
66
+ ## ⚠️ Ограничения
67
+
68
+ - Для лучшей точности используйте явно выраженную тональность
69
+ - Ирония и сарказм могут быть интерпретированы неправильно
70
+ - Рекомендуемая длина текста: 10-500 символов
71
+
72
+ ## 📞 Поддержка
73
+
74
+ При возникновении проблем:
75
+ 1. Обновите страницу
76
+ 2. Убедитесь, что текст на русском языке
77
+ 3. Сократите текст до 1000 символов
78
+
79
+ ---
80
 
81
+ *Приложение создано для демонстрации возможностей анализа тональности с использованием современных NLP технологий.*