Здравствуйте! В самом первом этапе когда на вход мы получаем исходную картинку (наприме
фотография буквы), требуется пройтись по ней окном n*n размера и умножения на ядро (матриц
свертки), для построения карт признаков (Feature Maps). Но нигде не написано какие значения должны быть в самом ядре (матрице свертки, то есть на какие значения надо умножать матрицу), можно ли будет использовать эту матрицу как ядро свертки для определения краев?
Так же если размер входной картинки 30*30, то можно ли будет проходиться по ней окном 5*5, этого достаточно для достижения оптимальной точности распознавания?
На какое ядро свертки лучше всего умножать участок входной картинки для наибольше
точности распознавания? Или изначально все значения в матрице ядра равны нулям? Можн
ли еще спросить, по какому правилу или формуле определяется количество карт признаков? Или если задача стоит в распознавании 26 букв Английского алфавита, то в каждом этапе построения карт признаков их должно быть ровно 26? Заранее Вам спасибо!
Ответы
Ответ 1
Сначала заполняй случайными значениями, а в процессе обучения корректируешь значения
Комментариев нет:
Отправить комментарий