RAQAMLI TEXNOLOGIYALARNING
YANGI
O‘ZBEKISTON
RIVOJIGA
TA’SIRI
Xalqaro ilmiy-amaliy konferensiyasi
выбор меры информативности
𝐼(𝑧)
и класса допустимых преобразований
𝐹
приводит к
конкретному методу снижения размерности.
Таким образом, снижение размерности исходного пространства признаков можно
интерпретировать как отображение
N-
мерного вектора
𝑥
в
ℓ
-
мерный вектор
𝑧
, которое в
общем случае можно представить как
𝑧 = 𝐹(𝑥)
, где
𝐹
-
допустимое преобразование, а
ℓ ≤ 𝑁
.
Обычно используют два варианта преобразования исходного пространства
признаков.
Первый вариант преобразования можно представить системой функций
{
𝑧
1
= 𝑓
1
(𝑥
1
, 𝑥
2
, … , 𝑥
𝑁
),
𝑧
2
= 𝑓
2
(𝑥
1
, 𝑥
2
, … , 𝑥
𝑁
),
… … … … … … … … … … . ,
𝑧
ℓ
= 𝑓
ℓ
(𝑥
1
, 𝑥
2
, … , 𝑥
𝑁
).
(2)
Здесь новые признаки
𝑧
1
, 𝑧
2
, … , 𝑧
ℓ
имеют вид функций (обычно линейных) от исходных
𝑥
1
, 𝑥
2
, … , 𝑥
𝑁
. При этом
ℓ < 𝑁
.
Второй вариант можно представить системой функций
𝑧
𝑖
= 𝑓
𝑖
(𝑥
𝑖
); 𝑖 = 1, 𝑁
,
(3)
𝑓(𝑥
𝑖
) = {
0,
если признак
𝑥
𝑖
исключается;
1,
если признак
𝑥
𝑖
оставляется.
В этом случае новая система признаков формируется как подмножество множества
исходных признаков
.
Методы, основанные на использовании преобразований типов (2) и (3), называются
методами снижения размерности исходного пространства признаков.
Далее рассматриваются наиболее известные методы снижения размерности,
основанные на использовании преобразования типа (3) и ориентированные на решение
задач классификации. Эти методы называются методами выбора признаков.
Ранее было отмечено, что методы выбора признаков основаны на использовании
преобразования типа (3), при котором новый признак
𝑧
𝑚
в системе
𝑧 = (𝑧
1
, 𝑧
2
, . . . , 𝑧
ℓ
)
представляется одним из исходных признаков
𝑥
1
, 𝑥
2
, … , 𝑥
𝑁
, т.е.
𝑧 = (𝑥
1
, 𝑥
2
, . . . , 𝑥
𝑁
)
,
ℓ < 𝑁
. Для
задачи распознавания образов определение нового набора признаков
𝑧
обычно связано с
оценкой качества классификации. Причем, согласно [4], при малых выборках поиск такого
набора можно производить, основываясь на минимизации верхней границы или
математического ожидания ошибок классификации при контроле. Известно также [5], что
данные ошибки могут характеризоваться величиной критерия качества разбиения классов
|