Распознавание образов в Python. Часть VIII – сохранение данных для обучения и тестирования

Предыдущая статья – Распознавание образов в Python. Часть VII – логика обработки изображения.

А сейчас мы будем использовать наши данные. Мы создадим массивы изображений, сохраним их и будем применять для распознавания образов.

Для этого мы напишем функцию createExamples:

def createExamples():
    numberArrayExamples = open('numArEx.txt','a')
    numbersWeHave = range(1,10)
    for eachNum in numbersWeHave:
        #print eachNum
        for furtherNum in numbersWeHave:
            # you could also literally add it *.1 and have it create
            # an actual float, but, since in the end we are going
            # to use it as a string, this way will work.
            print(str(eachNum)+'.'+str(furtherNum))
            imgFilePath = 'images/numbers/'+str(eachNum)+'.'+str(furtherNum)+'.png'
            ei = Image.open(imgFilePath)
            eiar = np.array(ei)
            eiarl = str(eiar.tolist())

            print(eiarl)
            lineToWrite = str(eachNum)+'::'+eiarl+'\n'
            numberArrayExamples.write(lineToWrite)

В видео подробно объяснена работа этой функции, но все же кратко поясним здесь основные моменты. Цель этой функции — просто добавить массив изображений в файл, чтобы мы могли позже им воспользоваться.

Здесь в качестве базы данных используем обычный текстовый файл. Это вполне нормально для небольших наборов данных, но для более серьезной работы лучше подойдет SQLite или MySQL.

SQLite это “облегченная” версия SQL. Она тоже представляет из себя обычный файл, но это несколько более эффективно, чем обычный текстовый файл. MySQL является, вероятно, самой популярной базой данных для работы с данными SQL.

При запуске функции createExamples() будет создан файл numArEx.txt, в который будут записаны числовые массивы данных. Далее мы пропустим эти массивы через логическую функцию, сравним с существующим шаблоном и сделаем обоснованный вывод.

Следующая статья: Распознавание образов на Python: Часть IX – базовое тестирование.

Перевод статьи “Saving our Data For Training and Testing”.

2 комментария к “Распознавание образов в Python. Часть VIII – сохранение данных для обучения и тестирования”

  1. Пингбэк: Распознавание образов в Python. Часть VII – логика обработки изображения - pythonturbo

  2. Пингбэк: Распознавание образов на Python. Часть IX – базовое тестирование - pythonturbo

Комментарии закрыты.