его исходной форме и определяется набор морфологических характеристик текстовой формы
слова: часть речи; род, число и падеж для существительных, число и лицо для глаголов и т.п.
Машинные окончания — элементы, описывающие формоизменение конкретной лексемы и представляемые в виде парадигм.
Девочка {девочка = S, жен, од = им, ед}
мыла {мыть = V, несов = прош, ед, изъяв, жен, перех | мыло = S, сред, неод = им, мн | = S, сред, неод = род, ед | = S, сред, неод =вин, мн}
пол {пол = S, муж, неод = им, ед | = S, муж, неод = вин, ед | = А, кратк, муж, им, ед}.
Морфологический анализ включает в себя следующие этапы:
1) нормализация словоформ, имеющая вид лемматизации, т.е. сведения различных словоформ к некоторому единому представлению — к исходной форме (лемме) или стемминга, т.е. возведения разных словоформ к одной квазиоснове;
2) частеречный тэгинг, т.е. указание части речи для каждой словоформы в тексте;
3) полный морфологический анализ — приписывание грамматических характеристик словоформе.