🐍 Где будем практиковаться писать код в течение курса?
Основным языком курса будет Python.
Тебе понадобится немного. В первую очередь, тебе нужна только среда разработки. Лучше
всего подойдет Jupyter Notebook (из дистрибутива Anaconda) или
Google
Colab.
Пропусти этот степ, если ты уже знаком с Google Colab.
ВАЖНО!!: Если вы открываете Colab-версии ноутбуков курса,
производите в них какие-то изменения, и хотите чтобы они сохранились - сохраните копию
на своём GoogleDrive
, иначе после перезагрузки страницы все изменения
исчезнут!
Сделать это можно, нажав кнопку Copy to Drive
:
Google Colab
- среда для
разработки
Подробнее про Colab
Что это?
Google Colab — платформа, которая позволяет исполнять код на Python прямо в браузере, используя ресурсы серверов Google. Более того, Colab позволяет объединять код на Python, Markdown и даже HTML в один документ, поэтому также он является удобным редактором.
Что можно использовать в Colab?
В Колабе есть несколько типов подписок, в каждом из них свои характеристики:
Тип | RAM | Кол-во вычислительных блоков | GPU | Время одной сессии | Цена |
Базовый план | 12 | 100 | NVIDIA T4 | 12 | 0$ |
Colab Pro | 32 | 100 | NVIDIA V100/A100 | 24 | 10$ |
Colab Pro+ | 52 | 500 | NVIDIA V100/A100 | 24 + фоновый режим | 50$ |
Что можно делать?
После выбора нужной подписки, Colab открывает большое количество возможностей (рекомендуется начинать с базовой бесплатной версии).
Выбор ускорителя и среды выполнения
В Colab есть возможность работы на ускорителях GPU и TPU, выбора расширенной среды выполнения, которая увеличивает объем RAM (оперативная память). Поэтому ты сможешь даже сетки погонять на GPU.
Использование bash-команд
Все виртуальные машины в Colab работают на Linux, поэтому выполнение произвольных
команд для работы с системой потребует знание bash. Их можно исполнять, либо открыв
терминал, находящийся внизу боковой панели задач, либо непосредственно в ячейках с
обычным синтаксисом, но с префиксом !
. Например:
!pip install <LIBRARY>
— установка pip зависимостей;
!wget <ENTER URL>
— скачивание страницы или файла с интернета.
Если знакомы с Magic functions, то тут их также можно использовать
с префиксом %
.
Хранилище
Для того чтобы расширить внутреннее хранилище, составляющее от 40 - 100GB в зависимости от ускорителя, можно привязать сессию к Google Drive. Для этого надо в отдельную ячейку вставить:
from google.colab import drive
drive.mount('/content/gdrive')
После перехода в %cd /content/gdrive/MyDrive/
будет доступен весь
диск.
Эта функция Колаба является одной из важных, так как позволяет сохранять
промежуточные веса ("чекпоинты") модели при обучении или, например, использовать
данные, не подгружая их каждый раз из других источников.
Форматирование
Колаб позволяет делать описания, писать заголовки к ячейкам с помощью языка Markdown. Для этого нужно создать блок с типом Text и форматировать его. Более того, можно выводить HTML, видео и картинки.