Содержание
- Локали
- Локализация данных
- Создание ResourceBundle
- Загрузка ResourceBundle
- Использование ResourceBundle
- Форматирование
- Форматирование чисел
- Форматирование дат и времени
- Форматирование сообщений
- Работа с текстом
- Сравнение строк
- Разбиение текста
- Запись текста
Примеры
zipДомашнее задание 15. Статистика текста
-
Создайте приложение
TextStatistics
, анализирующее тексты на различных языках.-
Аргументы командной строки:
- локаль текста,
- локаль вывода,
- файл с текстом,
- файл отчета.
- Поддерживаемые локали текста: все локали, имеющиеся в системе.
- Поддерживаемые локали вывода: русская и английская.
- Файлы имеют кодировку UTF-8.
-
Подсчет статистики должен вестись по следующим категориям:
- предложения,
- слова,
- числа,
- деньги,
- даты.
-
Для каждой категории должна собираться следующая статистика:
- число вхождений,
- число различных значений,
- минимальное значение,
- максимальное значение,
- минимальная длина,
- максимальная длина,
- среднее значение/длина.
-
Пример отчета:
Анализируемый файл "quine.ru-RU.in". Сводная статистика Число предложений: 30. Число слов: 117. Число чисел: 35. Число сумм: 3. Число дат: 3. Статистика по предложениям Число предложений: 30 (30 различных). Минимальное предложение: "Анализируемый файл "quine.ru-RU.in".". Максимальное предложение: "Число чисел: 35.". Минимальная длина предложения: 13 ("Число дат: 3."). Максимальная длина предложения: 109 ("GK: если сюда поставить реальное предложение, то процесс не сойдётся"). Средняя длина предложения: 37,7. Статистика по словам Число слов: 117 (48 различных). Минимальное слово: "GK". Максимальное слово: "языках". Минимальная длина слова: 1 ("с"). Максимальная длина слова: 18 ("TextStatisticsTest"). Средняя длина слова: 6,752. Статистика по числам Число чисел: 35 (21 различных). Минимальное число: -12345,67. Максимальное число: 12345,67. Среднее число: 221,381. Статистика по суммам денег Число сумм: 3 (3 различных). Минимальная сумма: 100,00 ₽. Максимальная сумма: 345,67 ₽. Средняя сумма: 222,83 ₽. Статистика по датам Число дат: 3 (3 различных). Минимальная дата: 23 мая 2025 г.. Максимальная дата: 30 мая 2025 г.. Средняя дата: 26 мая 2025 г..
-
Аргументы командной строки:
- Вы можете рассчитывать на то, что весь текст помещается в память.
-
При выполнении задания следует обратить внимание на:
- Декомпозицию сообщений для локализации.
- Согласование сообщений по роду и числу.
-
Приложение должно находиться в пакете
info.kgeorgiy.ja.*.i18n
и его подпакетах.