Тгпу заочное обучение: Платные образовательные услуги — Абитуриент ТГПУ

Содержание

ТГПУ: дистанционное обучение

Общая информация об учебном заведении

Полное название учебного заведения: Федеральное государственное бюджетное образовательное учреждение высшего образования «Томский государственный педагогический университет»

Сокращенное название: ТГПУ

Год основания: 1902

Лицензия: № 2135 от 13.05.2016

Аккредитация: № 3322 от 23.01.2020 до 23.01.2026

Получаемое образование

  • Дополнительное профессиональное образование
  • Повышение квалификации

Контактная информация

Адрес: 634061, г. Томск, ул. Киевская, д. 60

Телефон: +7 (3822) 31-14-56

Официальный сайт ТГПУ

Дистанционное обучение

Адрес: г. Томск, Киевская 60, каб. 209 (приемная комиссия ТГПУ)

Телефон:

+7 (3822) 31-14-12

Сайт заочного обучения в ТГПУ

ТГПУ 2022: Томский государственный педагогический университет

Общежитие:         Государственный:         Военная кафедра:        Бюджетные места:        Лицензия/аккредитация:  

Сравнить

Посмотреть    Удалить

Оценить шанс поступить

Томский государственный педагогический университет — центр образования, науки и культуры, один из ведущих педагогических вузов России. Научная деятельность университета охватывает актуальные направления фундаментального и прикладного естествознания, гуманитарных и психолого-педагогических наук. В настоящее время проводятся фундаментальные научно-исследовательские работы по различным отраслям науки. Томский государственный педагогический университет — признанный центр образования, науки и культуры, один из лидеров педагогического образования в России.

Максимум специальностей при подаче документов — 5

Доля трудоустроенных выпускников

После первого высшего очного

Документы можно подать Лично Почтой Онлайн

Томский государственный педагогический университет (ТГПУ)

ВУЗы / Безопасность жизнедеятельности

Основан: 1902 г.

Официальный сайт ТГПУ

Специальности ТГПУ

01.04.02 — Прикладная математика и информатика
02.04.01 — География
03.04.02 — Физика
03.06.02 — Связи с общественностью
03.12.01 — Теория и методика преподавания иностранных языков и культур
03.21.01 — Физическая культура и спорт
03.21.02 — Физическая культура для лиц с отклонениями в состоянии здоровья (адаптивная физическая культура)
03.24.01 — Реклама
04.04.01 — Химия
05.01.00 — Естественно-научное образование
05.01.02 — Биология
05.01.04 — Безопасность жизнедеятельности
05.02.00 — Физико-математическое образование
05.03.00 — Филологическое образование
05.03.01 — Русский язык и литература
05.03.03 — Иностранный язык
05.04.00 — Социально-экономическое образование
05.04.01 — История
05.04.02 — Юриспруденция
05.05.01 — Профессиональное обучение (по отраслям)
05.05.02 — Технология и предпринимательство
05.06.02 — Изобразительное искусство
05.07.00 — Педагогика
05.07.03 — Дошкольная педагогика и психология
05.07.06 — Педагогика и психология
05.07.08 — Педагогика и методика начального образования
05.07.11 — Социальная педагогика
05.07.15 — Логопедия
05.07.20 — Физическая культура
08.01.03 — Национальная экономика
08.05.07 — Менеджмент организации
09.03.02 — Информационные системы и технологии
09.04.02 — Информационные системы и технологии
10.01.03 — Социально-культурный сервис и туризм
23.02.00 — Информационные системы
38.03.01 — Экономика
38.03.02 — Менеджмент
38.03.06 — Торговое дело
38.04.01 — Экономика
38.04.02 — Менеджмент
41.03.06 — Публичная политика и социальные науки
42.03.01 — Реклама и связи с общественностью
43.03.01 — Сервис
43.03.02 — Туризм
43.04.02 — Туризм
44.03.01 — Педагогическое образование
44.03.02 — Психолого-педагогическое образование
44.03.03 — Специальное (дефектологическое) образование
44.03.04 — Профессиональное обучение (по отраслям)
44.03.05 — Педагогическое образование (с двумя профилями подготовки)
44.04.01 — Педагогическое образование
44.04.02 — Психолого-педагогическое образование
44.04.03 — Специальное (дефектологическое) образование
44.04.04 — Профессиональное обучение (по отраслям)
44.05.01 — Педагогика и психология девиантного поведения
45.03.02 — Лингвистика
45.04.02 — Лингвистика
45.05.01 — Перевод и переводоведение
47.03.03 — Религиоведение
47.04.03 — Религиоведение
49.03.01 — Физическая культура
49.03.02 — Физическая культура для лиц с отклонениями в состоянии здоровья (адаптивная физическая культура)
49.04.01 — Физическая культура
51.03.01 — Культурология
51.03.02 — Народная художественная культура
51.04.02 — Народная художественная культура

Очное — Бакалавр

02.01.00 — Химия
02.10.00 — География
03.16.00 — Реклама и связи с общественностью
03.33.00 — Религиоведение
03.43.00 — Физическая культура
03.57.00 — Лингвистика
05.10.00 — Профессиональное обучение (по отраслям)
07.15.00 — Народная художественная культура
08.01.00 — Экономика
08.02.00 — Менеджмент
10.01.00 — Сервис
10.04.00 — Туризм
23.04.00 — Информационные системы и технологии

Очное — Специалитет

03.57.01 — Перевод и переводоведение
05.04.07 — Педагогика и психология девиантного поведения

Очное — Магистратура

01.04.00 — Прикладная математика и информатика
01.12.00 — Физика

Очное — Бакалавр

03.44.00 — Физическая культура для лиц с отклонениями в состоянии здоровья (адаптивная физическая культура)

Автор Vladislav Ch Опубликовано

Оценка химического сходства с ускорением на GPU для крупномасштабных баз данных

Procedia Comput Sci. Авторская рукопись; Доступно в PMC 2016 20 октября.

Опубликовано в финальной отредактированной форме AS:

PMCID: PMC5072535

Nihmsid: NIHMS7

Marco Maggioni

1 Отдел компьютерной науки, University of Illinin

2 Факультет биоинженерии Иллинойского университета в Чикаго

Марко Доменико Сантамброджо

1 Факультет компьютерных наук, Иллинойский университет в Чикаго

3 Факультет вычислительной техники Миланского политехнического университета

4 Лаборатория компьютерных наук и искусственного интеллекта Массачусетского технологического института

Джи Лян

1 Факультет компьютерных наук, Иллинойский университет в Чикаго

2 Факультет биоинженерии Иллинойского университета в Чикаго

1 Факультет компьютерных наук, Иллинойский университет в Чикаго

2 Факультет биоинженерии Иллинойского университета в Чикаго

3 Факультет вычислительной техники Миланского политехнического университета

4 Лаборатория компьютерных наук и искусственного интеллекта Массачусетского технологического института

См. другие статьи в PMC, в которых цитируется опубликованная статья.

Abstract

Оценка химического сходства между молекулами является базовой операцией в хемоинформатике, вычислительной области, связанной с манипулированием информацией о химической структуре. Сравнение молекул является основой для широкого спектра приложений, таких как поиск в химических базах данных, обучение моделей прогнозирования для виртуального скрининга или агрегирование кластеров сходных соединений. Однако доступные в настоящее время многомиллионные базы данных представляют собой проблему для традиционных алгоритмов хемоинформатики, что вызывает необходимость в более быстрых методах подобия.В этой статье мы подробно анализируем преимущества использования многоядерных архитектур для расчета некоторых часто используемых коэффициентов химического сходства, таких как Танимото, Дайс или Косинус. Наша цель состоит в том, чтобы предоставить обширное доказательство концепции полезности архитектур графических процессоров для хемоинформатики, класса вычислительных задач, которые все еще не раскрыты. В нашей работе мы представляем общий алгоритм графического процессора для всеобщего химического сравнения, рассматривая как бинарные отпечатки пальцев, так и дескрипторы с плавающей запятой в качестве представления молекулы.Впоследствии мы применяем методы оптимизации, чтобы свести к минимуму доступ к глобальной памяти и еще больше повысить эффективность. Мы тестируем предложенный алгоритм на различных экспериментальных установках, ноутбуке с младшим графическим процессором и настольном компьютере с более производительным графическим процессором. В первом случае мы получаем ускорение от 4 до 6 раз по сравнению с одноядерной реализацией для отпечатков пальцев и от 4 до 7 раз для дескрипторов. В последнем случае мы получаем ускорение соответственно в 195-206 раз и в 100-328 раз.

Ключевые слова: хемоинформатика, GPU, химическое сходство, химические отпечатки пальцев, коэффициент Танимото

1 Введение проблемы, с особым акцентом на манипулировании химической структурной информацией [1]. Некоторые из его применений строго связаны с возможностью оценки химического сходства между соединениями.Например, поиск в химических базах данных требует тысяч сравнений, чтобы найти наиболее похожие соединения для молекулы запроса [2]. Другим примером является процесс, известный как виртуальный скрининг

[3]. После этапа обучения, основанного на алгоритмах интеллектуального анализа данных, модель может предсказать, обладает ли произвольная молекула желаемой биологической/химической активностью, сократив количество и стоимость 90 005 экспериментов in vitro и 90 006 экспериментов. С учетом машин опорных векторов [4] обучение модели основано на функции ядра между молекулами, которая примерно соответствует химическому сходству.Кроме того, полезно применять неконтролируемое обучение, чтобы объединять молекулы со сходной активностью [5]. Таким образом, оценка сходства соединений играет центральную роль в хемоинформатике.

Доступные в настоящее время многомиллионные базы данных, такие как PubChem [6] (31 миллион молекул), представляют собой проблему для традиционных алгоритмов хемоинформатики. Ситуация еще хуже, учитывая виртуальные библиотеки, построенные с использованием комбинаторной химии (почти 1 миллиард молекул в [7]).Проблемы масштабируемости возникают не только из-за размера базы данных, но и из-за сложности рассматриваемых алгоритмов. Хотя поиск в одной базе данных имеет линейную сложность O ( n ), более сложные алгоритмы, такие как агломерационная иерархическая кластеризация, могут потребовать квадратичного времени выполнения O ( n 2 ) или хуже. Следовательно, хемоинформатический анализ может быть практичным только в том случае, если мы сможем увеличить производительность выполнения такого большого количества сложных сравнений в рамках алгоритмов.

В настоящее время компьютерные архитектуры разрабатываются таким образом, чтобы предлагать растущий уровень параллелизма, непосредственно доступный для повышения производительности вычислений. В соответствии с этой точкой зрения графические процессоры зарекомендовали себя как распространенная научная параллельная архитектура [8]. Графические процессоры широко распространены, поскольку они являются неотъемлемой частью практически любой современной компьютерной системы. Графические процессоры являются научными, поскольку они обеспечивают высокую пропускную способность для операций с плавающей запятой (до 1,03 терафлопс/с), желательную функцию для приложений научных вычислений.Наконец, текущие графические процессоры параллельны, поскольку они разработаны в соответствии с философией многоядерного дизайна. Большие объемы кэш-памяти и сложные блоки управления заменены большим количеством простых вычислительных ядер (до 512 в одном чипе), использующих высокопараллельную рабочую нагрузку с очень регулярным шаблоном выполнения. Важные области научных вычислений, такие как выравнивание последовательностей [9] и моделирование молекулярной динамики [10, 11], демонстрируют растущую популярность вычислений на GPU. Фактически, графические процессоры делают доступной для ученых и исследователей по всему миру архитектуру суперкомпьютеров при незначительной доле стоимости и энергопотребления по сравнению с большими суперкомпьютерами или кластерами.Эта тенденция еще не наблюдалась для приложений хемоинформатики. Насколько нам известно, очень мало работ сочетают задачи хемоинформатики с параллельными архитектурами, в частности с графическими процессорами [12, 13].

Идея реализации вычислений подобия на GPU не совсем нова. В [12] автор рассматривает молекулы, представленные в виде канонических строк, известных как SMILES. Следовательно, химическое сходство основано на текстовом сравнении. Несмотря на неоспоримое преимущество простоты и точности, сравнимой с бинарными отпечатками пальцев, SMILES не может встраивать структурную или химическую информацию, как в дескрипторы с плавающей запятой.Работа, представленная в [13], вместо этого рассматривает бинарные отпечатки пальцев и коэффициенты Танимото для обучения модели SVM. Однако алгоритмы хемоинформатики используют широкий диапазон представлений молекул и коэффициентов сходства, поэтому представленный анализ не выглядит исчерпывающим. Наконец, в [14] была представлена ​​оценка коэффициента Танимото двоичных отпечатков пальцев на трех различных архитектурах (четырехъядерная архитектура Intel, архитектура Cell и архитектура GPU). Лежащая в основе идея сравнения различных философий дизайна интересна, но предлагаемая реализация графического процессора недостаточно оптимизирована, что делает все результаты смещенными в сторону четырехъядерных и сотовых архитектур.Сосредоточившись на предложенных результатах, кажется необычным, что один поток процессора может работать в три раза быстрее, чем GPU, для вычисления большого количества коэффициентов Танимото с плавающей запятой.

Основным вкладом этой работы является подробный анализ преимуществ использования многоядерных архитектур для вычисления пяти различных широко используемых коэффициентов сходства (Танимото, Дайс, Косинус, Евклидов и Хэмминга/Манхэттена) с учетом как двоичных отпечатков пальцев, так и чисел с плавающей запятой. дескрипторы как представление молекулы.Практическая цель состоит в том, чтобы достичь более высокой пропускной способности выполнения, чтобы справиться с вышеупомянутыми проблемами масштабируемости. Мы предлагаем общий алгоритм GPU, который превосходит производительность одноядерного процессора до двух порядков. Наша интеллектуальная цель состоит в том, чтобы предоставить широкое доказательство концепции полезности архитектур графических процессоров в хемоинформатике, классе вычислительных задач, которые все еще не раскрыты.

Остальная часть статьи организована следующим образом.В разделе 2 кратко представлены два распространенных метода, используемых для создания бинарного отпечатка пальца и вектора реальных дескрипторов для заданной молекулы. Кроме того, он вводит несколько широко используемых коэффициентов химического сходства. Затем раздел 3 посвящен переделке алгоритма для его адаптации к многоядерной архитектуре. Кроме того, мы представляем дальнейшие оптимизации, чтобы минимизировать доступ к глобальной памяти и увеличить достигнутое ускорение. Раздел 4 посвящен тестам производительности с учетом различных экспериментальных настроек, ноутбука с младшим графическим процессором и настольного компьютера с более производительным графическим процессором.В первом случае мы получили ускорение от 4 до 6 раз по сравнению с одноядерной реализацией для отпечатков пальцев и от 4 до 7 раз для дескрипторов. В последнем случае мы получили соответственно ускорение от 195 до 206 и от 100 до 328 раз. Наконец, Раздел 5 завершается некоторыми заключительными утверждениями и предложениями для будущей работы.

2 Химическое сходство

Основанием для оценки сходства является принцип сходных свойств [1], согласно которому структурно сходные молекулы, как правило, обладают сходными свойствами и, вероятно, проявляют одинаковую активность.Этот принцип позволяет идентифицировать наборы потенциально активных соединений или препаратов in-silico , уменьшая количество и стоимость экспериментов in-vitro . В общем, необходимо соответствующее представление молекул, чтобы справиться с представленными проблемами масштабируемости, сохраняя при этом достаточное количество информации о реальном соединении. Методы, основанные на трехмерных графиках и методах трехмерного наложения [15], имеют слишком высокую вычислительную сложность для применения к большим базам данных молекул.В нашей работе мы фокусируемся на более эффективных и компактных представлениях, таких как двоичные отпечатки пальцев и дескрипторы с плавающей запятой. С точки зрения многоядерной архитектуры можно утверждать, что этот выбор выгоден, поскольку графические процессоры могут эффективно обеспечивать высокопроизводительные вычисления, особенно для чисел с плавающей запятой [16]. Кроме того, отпечатки пальцев и дескрипторы сохраняют лежащую в основе топологическую и структурную информацию, необходимую для значимой оценки химического сходства.

2.1 Двоичные отпечатки пальцев

Отпечатки пальцев представляют молекулы в виде двоичных векторов фиксированной длины, где каждый бит соответствует присутствию определенного фрагмента словаря, как показано . Для произвольной молекулы ее отпечаток можно вычислить с помощью алгоритма изоморфизма подграфов [17]. Эта операция может быть дорогостоящей в вычислительном отношении, но она выполняется только один раз, поэтому ее стоимость незначительна при оценке сходства. Основное преимущество отпечатков пальцев заключается в том, что можно получить топологическую информацию об атомной структуре.Следовательно, существует корреляция между сходством отпечатков пальцев и химическим/биологическим сходством. С другой стороны, выбор словаря фрагментов имеет решающее значение для получения хороших результатов в целевом приложении хемоинформатики. Фрагменты не должны быть слишком распространенными или слишком редкими, иначе информация, закодированная в битах отпечатков пальцев, станет не очень разборчивой или релевантной только для нескольких молекул. Словарь может быть выбран экспертами в предметной области или с использованием методов интеллектуального анализа данных. Более подробно было показано, что отпечатки пальцев, основанные на словаре, полученном путем анализа ациклических фрагментов, более эффективны для поиска и классификации соединений [18].

Каждый бит в отпечатке соответствует словарю фрагментов.

2.2 Дескрипторы с плавающей запятой

Векторы дескрипторов с плавающей запятой более подходят, чем отпечатки пальцев, для характеристики физико-химических свойств, таких как форма или заряд. Неудивительно, что встраивание этой информации дает лучшие результаты для основного приложения хемоинформатики, как показано в [19]. Значения дескриптора обычно получают путем применения алгоритмических методов к молекулярным структурам.Техника, представленная в [19], обеспечивает высокоточное описание трехмерных форм молекул путем захвата межатомных расстояний в виде 12-мерного реального вектора. Более подробно, этот метод определяет четыре точные точки в трехмерном пространстве и вычисляет расстояние от каждого атома, определяя четыре различных распределения расстояний (по одному для каждой фиксированной точки), как показано на рис. Согласно статистической теории, распределение полностью определяется своими моментами. По этой причине метод может аппроксимировать трехмерную форму молекулы, беря первые три момента uk=∑i=1ndik∕n каждого распределения расстояний, создавая в общей сложности 12 реальных дескрипторов.Техника была последовательно обогащена тремя дополнительными дескрипторами, чтобы учесть хиральность и электростатические соображения [20]. Можно возразить, что принцип сходных свойств все еще остается в силе. На самом деле молекулы с похожими дескрипторами будут иметь сходную трехмерную форму и, вероятно, будут проявлять одинаковую активность. И последнее, но не менее важное: дескрипторы являются действительными значениями, поэтому любая реализованная операция выиграет от возможностей вычислений с плавающей запятой архитектур графических процессоров.

Числовое распределение может быть создано путем измерения расстояния каждого атома от точки (т. е. центра тяжести).

2.3 Коэффициенты химического сходства

Мы только что описали, как представить молекулу в виде бинарного отпечатка пальца или вектора с плавающей запятой. Имея две молекулы, их сходство можно оценить с помощью множества различных коэффициентов сходства, которые были разработаны в течение многих лет. Наиболее часто используемые в хемоинформатике описаны в . Все коэффициенты (включая евклидовы и манхэттенские/хемминговые) сформулированы для непосредственного измерения сходства.Для молекулы A x iA представляет i -компонент соответствующего вектора дескрипторов с плавающей запятой, тогда как a представляет количество битов, установленных на единицу в соответствующем отпечатке пальца. Компонент x iB и b имеют аналогичное значение для молекулы B . Наконец, c представляет количество битов, которые являются одним для обоих отпечатков пальцев. Можно возразить, что коэффициенты Танимото, Дайса и Косинуса фокусируются на общих битах как признаке подобия, тогда как евклидовы и манхэттенские коэффициенты рассматривают общее отсутствие (нулевой бит) как точку подобия.

Таблица 1

Коэффициенты сходства по хемоинформатике адаптированы из [1].

Имя Реальные векторы Двоичные отпечатки пальцев
Танимото SAB=∑i=1nxiAxiB∑i=1n(xiA)2+∑i=1n(xiB)2−∑i=1nxiAxiB SAB=ca+b−c
Игра в кости SAB=2∑i=1nxiAxiB∑i=1n(xiA)2+∑i=1n(xiB)2
SAB=2ca+b
Косинус SAB=∑i=1nxiAxiB∑i=1n(xiA)2∑i=1n(xiB)2 SAB=кабина
Евклидова SAB=11+∑i=1n(xiA−xiB)2 SAB=11+a+b−2c
Манхэттен/Евклидов SAB=11+∑i=1n∣xiA−xiB∣ SAB=11+a+b−2c

3 Алгоритм и оптимизация графического процессора

Оценка химического сходства соответствует вычислению коэффициента с использованием значений с плавающей запятой (которые доступны непосредственно как реальные дескрипторы) или целых значений (которые являются получено из подсчета битов отпечатка пальца).Широкий спектр приложений хемоинформатики, таких как кластеризация молекул, требует квадратичного числа O ( n 2 ) сравнения химического сходства. Следовательно, представляется разумным оценить эффективность архитектуры графического процессора, выполнив ровно n 2 сравнений (расчет коэффициента сходства всех со всеми). В нашем обсуждении мы специально ссылаемся на унифицированную архитектуру вычислительных устройств NVIDIA (CUDA) [8]. Из-за нехватки места мы вводим архитектурные детали только тогда, когда это необходимо для объяснения алгоритма и введенных оптимизаций.Более полное описание рассматриваемой многоядерной архитектуры и модели ее программирования можно найти в [8, 16]. По тем же причинам мы сосредоточим свои усилия на объяснении графических представлений предлагаемых алгоритмических методов GPU, избегая длинных разделов с CUDA-подобным псевдокодом.

3.1 Базовый алгоритм

Общее вычисление можно интуитивно представить как квадратную матрицу независимых вычислений подобия между молекулами-столбцами и молекулами-строками, которые могут выполняться одновременно.Эта алгоритмическая структура представляет собой случай удручающе параллельной рабочей нагрузки, поэтому идеально подходит для выполнения на многоядерной архитектуре. Более подробно, каждое сравнение сходства связано с потоком выполнения графического процессора, как показано на рисунке . В соответствии с базовой архитектурой потоки логически организованы в блоки. Аналогичным образом ядра графического процессора (также известные как потоковые процессоры) организованы в группы фиксированного размера (также известные как потоковые мультипроцессоры). Во время выполнения блоки потоков назначаются SM, которые одновременно выполняют потоки на соответствующих SP в соответствии с искаженной парадигмой Single Instruction Multiple Thread (SIMT) [8].

Вычисление химического сходства, разложенное на потоки графического процессора.

Как уже упоминалось, мы не можем напрямую вычислять коэффициенты отпечатков пальцев как операцию с плавающей запятой, поскольку нам нужно получить подсчет битов из двоичных векторов. Некоторые компьютерные архитектуры изначально предлагают эту операцию как часть набора инструкций. Алгоритм GPU, представленный в [14], использует для реализации подсчета подход, основанный на повторных сдвигах вправо. Мы предпочитаем подход, основанный на 8-битной таблице поиска. Более того, мы храним эту структуру данных в постоянной памяти, специальной памяти графического процессора, которая эквивалентна быстрому кешу только для чтения, разделяемому между всеми потоками.Учитывая отпечаток пальца, мы накапливаем общее количество битов, сканируя каждый байт и добавляя соответствующее значение счетчика, считанное из таблицы поиска. Простое рассмотрение коэффициентов может ускорить выполнение как CPU, так и GPU. Можно возразить, что для молекулы A необходимо вычислить ∑i=1n(xiA)2 и a только один раз, даже если молекула A участвует в множественных химических сравнениях. Таким образом, целесообразно добавить этап предварительного вычисления, после которого промежуточные значения ∑i=1n(xiA)2 и a сохраняются в памяти для повторного использования в дальнейшем для расчета реальных коэффициентов подобия.Поскольку каждое предварительное вычисление молекулы является независимым, процедуру можно легко реализовать и на архитектуре графического процессора, назначая поток выполнения графического процессора для каждого вычисления.

3.2 Метод тайлинга

Представленный алгоритм графического процессора может принести пользу большому количеству вычислительных блоков, доступных в многоядерной архитектуре. Однако в большинстве доступных архитектур графических процессоров потоки вынуждены напрямую обращаться к большой глобальной памяти, не используя какой-либо механизм прозрачного кэширования для использования локальности данных.Как видно из невпечатляющих результатов GPU, полученных в [14], этот недостаток может представлять собой серьезное узкое место, которое замедляет вычисления до невыгодного ускорения по сравнению с одноядерным процессором. С другой стороны, архитектуры графических процессоров предоставляют каждому SM быструю кэш-память, известную как разделяемая память, которую можно использовать для решения выделенной проблемы. Мы также можем утверждать, что метод явного кэширования, представленный в этом разделе, выгоден для графических процессоров, основанных на недавней архитектуре Fermi [8] (первый графический процессор с прозрачной кэш-памятью).

В литературе доступен общий метод оптимизации, известный как tiling [16, 21]. Основная идея использует преимущества модели программирования CUDA, в которой потоки в одном блоке могут использовать общую память для кэширования данных и синхронизации. Таким образом, можно разложить исходную вычисленную матрицу n × n на b × b тайлов (или блоков). Внутри плитки потоки должны получить доступ к b молекул строк и b молекул столбцов для выполнения сравнений химического сходства.Вместо того, чтобы иметь два доступа к глобальной памяти для каждого потока, молекулы совместно предварительно загружаются в общую память, как показано на рисунке . Последующие обращения к памяти будут производиться локально, уменьшая количество обращений к глобальной памяти в b раз. Более подробно, у нас есть 2 b 2 доступов без тайлинга. Учитывая в общей сложности 2 b доступов для предварительной загрузки молекул, коэффициент уменьшения можно легко рассчитать как 2 b 2 /2 b = b .Другими словами, плитки большего размера обеспечивают лучшее совместное использование кеша, что приводит к уменьшению количества обращений к глобальной памяти. С практической точки зрения, мы должны поддерживать как можно большие блоки, помня о существующих архитектурных ограничениях, касающихся общей памяти, доступной для SM, и максимального количества потоков, с которыми может работать планировщик SM.

Тайл потока 2×2 предварительно загружает молекулы строк и столбцов в разделяемую память.

3.3 Техника скользящих плиток

Алгоритм графического процессора может быть дополнительно улучшен за счет учета скользящих плиток.До сих пор мы рассматривали двузначную связь между потоками графического процессора и сравнениями подобия. Однако можно возразить, что поток может вычислить не только один коэффициент подобия (т. е. поток может вычислить целую строку коэффициентов). Это соображение приводит к скользящим плиткам, которые итеративно перемещаются по строке для вычисления всех коэффициентов в матрице. Другими словами, каждый поток будет вычислять коэффициент со смещением [0, b , 2 b , 3 b , …, n b ] от своей начальной позиции (в исходном подходе вместо этого мы использовали n/b отдельные потоки, соответствующие разным блокам).Скользящие плитки могут уменьшить количество обращений к глобальной памяти за счет повторного использования молекул строк в общей памяти. Как показано , строки загружаются один раз, тогда как молекулы столбцов обновляются в соответствии с положением плитки.

Молекулы строки фиксированы, тогда как молекулы столбца зависят от положения плитки.

Представленная методика почти вдвое сокращает количество обращений к глобальной памяти. Учитывая ( n/b ) блоков в строках, метод разбиения на блоки требует 2b · ( n/b ) = 2 n доступов.Для скользящих плиток нам нужно b доступов для загрузки молекул строки и b · ( n/b ) = n доступов для загрузки молекул столбца. Понижающий коэффициент тогда равен 2 n /( n + b ) ≈ 2 при условии, что b n . Можно также отметить, что скользящие плитки требуют того же объема общей памяти, который требуется для метода плиток , поскольку молекулы столбцов всегда загружаются в одну и ту же ячейку памяти.

3.4 Техника широкой скользящей плитки

Мы упоминали, что выбор большого b положительно влияет на производительность памяти, несмотря на то, что его применимость ограничена двумя архитектурными ограничениями. Однако можно частично решить проблему, связанную с максимальным количеством потоков, содержащихся в тайле. Ярлык по-прежнему основан на том факте, что поток может вычислять более одного коэффициента сходства. Следовательно, один блок может покрыть тайл в k раз шире (построчное направление).Более подробно, каждый поток будет отвечать за вычисление коэффициентов, расположенных по смещению строки [0, b , 2 b , …, ( k – 1) b ], отображающих более широкий тайл. Оптимизация доступа к памяти будет достигнута за счет увеличения постоянной памяти, выделенной для молекул-строк, с коэффициентом b и путем сохранения итеративного скользящего механизма для покрытия всей расчетной матрицы. В примере, показанном , блок одного потока покрывает двойную плитку, поскольку каждый поток вычисляет два коэффициента при разных смещениях строк [0, b ].Опять же, мы можем количественно оценить сокращение количества обращений к глобальной памяти. Учитывая k как коэффициент ширины нового тайла, предыдущий метод скользящего тайла требует k ( n + b ) доступов. Принимая во внимание более широкие плитки, нам нужно k · b доступов для загрузки молекул строк и еще n доступов для загрузки молекул столбцов. Затем коэффициент сокращения составляет K ( N + B )/( N + KB ) ≈ K , предполагая B N , а также КБ N .Можно возразить, что представленный метод увеличивает объем разделяемой памяти, необходимой для блока, сохраняя при этом неизменным количество потоков внутри блока. Следовательно, размер тайла будет зависеть только от прежнего архитектурного ограничения. Принципы оптимизации, представленные в [21], также сосредоточены на развертывании цикла, чтобы уменьшить воздействие, связанное с накладными расходами цикла (т. е. проверка условия или увеличение переменной индекса). Однако эта оптимизация может уменьшить количество активных блоков потока, когда требуется слишком много дополнительных регистров потока.Кроме того, развертывание цикла не является гибким для различной длины дескриптора/отпечатка пальца, поскольку это жестко закодированный метод. По этим причинам мы предпочитаем не рассматривать развертывание цикла в нашей оптимизированной реализации GPU.

Более широкая скользящая плитка, соответствующая тому же блоку резьбы.

4 результатов

Мы разрабатываем реализацию нашего общего алгоритма графического процессора на основе CUDA для каждого коэффициента химического сходства, представленного в . Основная цель — оценить преимущества, связанные с многоядерными архитектурами и принятыми принципами оптимизации.Базовая производительность измеряется с точки зрения времени выполнения, необходимого одноядерному процессору для вычисления матрицы химического сходства всех со всеми. Затем ускорение графического процессора связано с этим измерением времени. Напомним, что вычисление химического подобия является распространенной и относительно простой операцией, используемой в различных алгоритмах хемоинформатики. Поэтому не существует отдельного оптимизированного кода для сравнения. В любом случае, мы компилируем нашу экспериментальную реализацию, всегда активируя доступные флаги оптимизации (т.е. −O4 в компиляторе gcc), чтобы оценить производительность в сравнении с разумно оптимизированным кодом. В этом разделе мы также обеспечиваем многопоточное выполнение алгоритма на двухъядерном процессоре, чтобы представить справедливое сравнение между различными вычислительными архитектурами.

4.1 Параметры CUDA и набор данных молекул

Согласно модели программирования CUDA [22], количество активных блоков потоков ограничено максимальным количеством потоков в SM. Следовательно, мы зафиксировали b = 16, чтобы иметь 256 потоков для блока и хороший объем совместно используемой памяти внутри блока.В зависимости от вычислительных возможностей, фактически реализованных в GPU-устройстве, количество активных блоков варьируется от 3 до 6. Мы также зафиксировали k = 4, чтобы обеспечить достаточно большие тайлы, не превышая доступную общую память для SM.

Мы тестируем наш алгоритм графического процессора на наборе случайно сгенерированных отпечатков молекул и наборе случайно сгенерированных дескрипторов молекул. Как уже упоминалось, наша работа сосредоточена на измерении ускорения производительности, поэтому мы удобно генерируем случайные данные.Можно возразить, что это упрощение не влияет на полученное ускорение, поскольку время работы алгоритма зависит только от количества молекул. Отпечатки пальцев имеют длину 256 бит, чтобы предложить сравнение результатов с расчетами Танимото, выполненными в [14]. Векторы дескрипторов состоят из 15 значений с плавающей запятой одинарной точности в соответствии с методом, описанным в [20]. Мы рассмотрели экспоненциально большие наборы данных от 1600 молекул до 51200 молекул. Соответствующая матрица химического сходства имеет квадратичный размер и не всегда может поместиться в памяти графического процессора.По этой причине, когда матрица слишком велика, мы разбиваем ее на куски по 128 Мбайт, которые вычисляются GPU один за другим.

4.2 Результаты на встроенном графическом процессоре ноутбука

Для нашего экспериментального результата мы рассмотрели две разные платформы, соответствующие обычным компьютерным системам, легко доступным для ученых и исследователей во всем мире. Этот выбор согласуется с мнением о том, что архитектуры графических процессоров представляют суперкомпьютеры для масс [16]. Первая компьютерная система — это ноутбук с процессором Intel Core [email protected], со встроенной NVIDIA GeForce [email protected] (16 ядер CUDA и 256MB памяти DDR3 совместно с CPU) и с MacOSX в качестве операционной системы. Мы скомпилировали наше ядро ​​CUDA с помощью компилятора NVIDIA nvcc на основе компилятора GNU gcc. показаны результаты, касающиеся коэффициентов химического сходства, рассчитанных как для двоичных отпечатков пальцев (верхняя таблица), так и для дескрипторов с плавающей запятой (нижняя таблица). Каждая строка соответствует все большему набору данных. Для каждого возможного коэффициента мы сообщаем об увеличении производительности по сравнению с базовым одноядерным процессором, соответственно для базового алгоритма графического процессора и для алгоритма графического процессора с широкой скользящей плиткой.Глядя на результаты, нетрудно заметить, что мы получаем ускорение в 4-6 раз. Этот результат можно считать удовлетворительным, учитывая базовую компьютерную систему, в которой довольно мощный процессор сочетается с недорогим интегрированным графическим процессором. Также можно отметить, что введенные алгоритмические оптимизации обеспечивают дополнительное ускорение в 2-3 раза по сравнению с базовым алгоритмом GPU. Наилучший средний прирост производительности получается при использовании коэффициента Танимото, так как он имеет самую простую формулировку. Снова вспоминая, можно утверждать, что коэффициент Танимото содержит уникальное деление с плавающей запятой, тогда как другие коэффициенты также содержат умножение на два или корни.

Таблица 2

Ускорение графического процессора по сравнению с одноядерным процессором ноутбука.


8 Хэмминг 90 421 4.31x 4.33x 4.44x 2.97x 4.96x 8
4,268x 9097x 3.87x 3.59x 4.50x
# Молекула
Отпечатки пальцев
Танимото Игра в кости Косинус Евклидов 38 38
Базовый графический процессор
(ускорение)
Доп. GPU
(ускорение)
Базовый GPU
(ускорение)
Доп. GPU
(ускорение)
Базовый GPU
(ускорение)
Доп.GPU
(ускорение)
Базовый GPU
(ускорение)
Доп. GPU
(ускорение)
Базовый GPU
(ускорение)
Доп. GPU
(ускорение)
одна тысяча шестьсот 2.30x 5.75x 2.26x 4.25x 2.29x 4.31x 2.29x 4.31x 2.19x
3200 2,30x 6.01X 2.25x 4.43x 2.27x 4.48x 2.28x 4.49x 2.17x 4.48x
6400 2.40x 5.89x 2.29x 4.46x 2.26x 4.41x 2.28x 4.47x 2.15x
12800 2.79x 6.09x 2.28x 4.51x 2.28x 4.54x 2.28x 4.51x 2.21x
25600 3.01x 6.34x 2.39x 4.74x 2.40x 4.78x 2.41x 4.79x 2.98x 6.32x
51200 2.94x 5.87x 2.93x 5.84x 2.98x 5.98x 5.91x 2,95x 5,90x
+
Среднее 2.62x 5.99x 2.40x 4.71x 2.41x 4.75x 2.42x 4.75x 2.44x

# Молекула
Дескрипторы
Танимото Кубик Косинус Евклидов Манхэттен
Базовый графический процессор
(ускорение)
Доп.GPU
(ускорение)
Базовый GPU
(ускорение)
Доп. GPU
(ускорение)
Базовый GPU
(ускорение)
Доп. GPU
(ускорение)
Базовый GPU
(ускорение)
Доп. GPU
(ускорение)
Базовый GPU
(ускорение)
Доп. GPU
(ускорение)

1600 2,91x 4,87x 2,81x 4,68x 2.77x 4.43x 2.13x 3.69x
3200 2.90x 5.10x 2.87x 5.09x 3.17x 5.47x 2.63x 4.61x 2.11x
6400 2.86x 4.83x 2.83x 5.89x 3.07x 6.26x 2.99x 4.20x 2.44x
12800 3.08x 5.61x 3.06x 7.10x 3.23x 7.43x 3.19x 4.73x 2.62x 4.01x
25600 3.81x 7.35x 3.78x 9.27x 3.84x 9.34x 4.33x 6.50x 3.79x 5.83x
51200 4.01X 9.92x 4.00x 9.89x 3.96x 7.68x 4.48x 6.79x 3.90x 6.03x
+
Среднее 3.26x 6.28x 3.22x 6.99x 3.39x 6.86x 3.40x 5.21x 2.83x

Нижняя часть вместо этого относится к коэффициентам, рассчитанным на дескрипторах молекул.Глядя на результаты, мы снова имеем удовлетворительное ускорение от 4 до 7 раз, на которое повлияло ускорение в 2 раза, связанное только с оптимизацией. Аналогично тому, как это делается для подсчета битов отпечатков пальцев, мы можем предварительно вычислить ∑i=1n(xiA)2 и ∑i=1n(xiB)2 для коэффициентов Танимото, Дайса и Косинуса. Эта оптимизация видна в полученных результатах (коэффициенты Евклида и Манхэттена имеют меньшее ускорение). Мы также можем наблюдать корреляцию между ускорением и размером набора данных молекул. В общем, алгоритм GPU может достигать высокой скорости FLOP/s, когда он не ограничен памятью (другими словами, он имеет много операций с плавающей запятой и мало обращений к памяти).Это не относится к коэффициентам отпечатков пальцев, где выполняется мало операций с плавающей запятой. Следовательно, ускорение кажется ограниченным. Мы также должны отметить, что планировщик графического процессора использует преимущества высокой рабочей нагрузки, скрывая задержку памяти потока при выполнении других потоков. Это может разумно объяснить тенденцию к лучшему ускорению при больших рабочих нагрузках молекул.

4.3 Результаты на современном настольном графическом процессоре

Вторая компьютерная система, которую мы рассмотрели в наших экспериментах, представляет собой настольный компьютер, оснащенный процессором AMD Athlon 64 [email protected]ГГц с последним NVIDIA GeForce [email protected] (336 ядер CUDA и 1 ГБ выделенной памяти). памяти GDDR5) и с Windows XP в качестве операционной системы.Компилятор NVIDIA nvcc теперь основан на компиляторе Visual Studio. Учитывая, что аппаратная конфигурация несбалансирована по отношению к вычислениям на GPU, мы ожидаем получить ускорение примерно на два порядка. Мы можем оценить приблизительное 21-кратное улучшение по сравнению с системой ноутбука, поскольку количество ядер CUDA увеличено с 16 до 336. В приведенной выше части показаны результаты, касающиеся коэффициентов химического подобия, рассчитанных для бинарных отпечатков пальцев. Как мы видим, мы получаем ускорение от 195 до 206 раз по сравнению с базовым однопоточным процессорным временем.Неудивительно, что этот результат даже лучше теоретического 126-кратного улучшения (получаемого как среднее ускорение графического процессора ноутбука в 6 раз, умноженное на 21). При этом введенные алгоритмические оптимизации дают приближенное улучшение в 2 раза. По аналогии с платформой ноутбука наилучшее ускорение достигается при более простом коэффициенте (Танимото). Можно возразить, что вычисления больше не ограничены памятью, поскольку ускорение коррелирует с размером набора данных о молекулах. Фактически, более быстрая память GDDR5 обеспечивает достаточную пропускную способность, чтобы не создавать узких мест.

Таблица 3

Ускорение графического процессора по сравнению с одноядерным процессором для настольных ПК.


8 Хэмминг 171.42x 176.61x 226.43x 204.76x 8
92x 296.13x 335.20x 341.44x 190,168x 122,35x 190,68x 67x
# Молекула
Отпечатки пальцев
Танимото Игра в кости Косинус Евклидов 38 38
Базовый графический процессор
(ускорение)
Доп. GPU
(ускорение)
Базовый GPU
(ускорение)
Доп. GPU
(ускорение)
Базовый GPU
(ускорение)
Доп.GPU
(ускорение)
Базовый GPU
(ускорение)
Доп. GPU
(ускорение)
Базовый GPU
(ускорение)
Доп. GPU
(ускорение)

один тысяча шестьсот 108.45x 174.53x 102.01x 163.68x 111.82x 179.68x 109.13x 174.89x 96.61x
3200 110.41x 180.11x 103.30x 168.44x 112.57x 183.98x 110.01x 177.99x 97.07x
6400 121.59x 199.87x 117.43x 188.69x 116.87x 186.61x 117.32x 191.05x 112.67x 196.85x
12800 132.77x 219.63x 126.40x 208.94x 121.16x 189.24x 124.62x 204.11x 128.27x 217.08x
25600 138.15x 229.18x 132.21x 219.26x 141.32x 234.30x 139.22x 230.22x 136.06x
51200 139.17x 236.54x 136.47x 225.00x 147.12x 243.40x 145.21x 239.32x 145.92x 240.18x

Среднее 125.19x 206.68x 119,64x 195,67x 125.14x 202.87x 124.25x 202.93x 119,43x

# Молекула
Дескрипторы
Танимото Кубик Косинус Евклидов Манхэттен
Базовый графический процессор
(ускорение)
Доп.GPU
(ускорение)
Базовый GPU
(ускорение)
Доп. GPU
(ускорение)
Базовый GPU
(ускорение)
Доп. GPU
(ускорение)
Базовый GPU
(ускорение)
Доп. GPU
(ускорение)
Базовый GPU
(ускорение)
Доп. GPU
(ускорение)

1600 106,11x 109,69x 104,45x 108,85x 115.80x 71.10x 87.00x 240.64x
3200 107.16x 111.32x 107.42x 111.48x 107.82x 119.02x 71.10x 87.60x 243.90x 306.76x
6400 111.44x 115.94x 112.36x 117.12x 115.68x 124.05x 86.73x 96.37x 282.43x 320.98x
12800 115.71x 120.56x 117.30x 122.76x 123.54x 129.08x 102.36x 105.13x 320.95x
25600 117.43x 122.39x 117.58x 124.23x 125.05x 130.96x 102.93x 105.80x 327.32x
51200 145.59x 152.29x 148.21x 155.68x 151.82x 159.08x 116.91x 120.12x 354,58x 368,86x

Среднее 117,54x 121,53x 117,89x 123,35x
91,86x 100,34x 294,97x 328,23x

Достигнутая производительность улучшена ускорением от 100 до 328 раз. Как мы видим, введенные алгоритмические оптимизации играют небольшую роль в этом улучшении. Также легко заметить, что коэффициент Манхэттена на сегодняшний день имеет наилучшее ускорение. Этот результат, вероятно, связан с простотой коэффициента Манхэттена и с оптимизациями, изначально реализованными архитектурой графического процессора NVIDIA Fermi [8].Расчеты коэффициентов Танимото, Дайса и Косинуса по-прежнему оптимизируются за счет предварительного вычисления ∑i=1n(xiA)2 и ∑i=1n(xiB)2, что дает приблизительно 25%-ное преимущество в производительности по сравнению с коэффициентом Евклида. Кроме того, вычисление не ограничено памятью, поскольку ускорение по-прежнему коррелирует с количеством рассматриваемых дескрипторов молекул.

4.4 Сравнение с двухъядерной архитектурой ЦП

Мы реализовали многоядерную версию нашего кода с использованием библиотек Pthreads [23]. Поскольку предлагаемая рабочая нагрузка представляет собой случай досадного параллелизма, можно легко распределить вычисления между потоками.Если говорить более подробно, мы используем четыре потока, чтобы загрузить доступные двухъядерные процессоры. Полученные результаты представлены в . Как и ожидалось, двухъядерная реализация линейно увеличивает производительность примерно в 2 раза. Когда есть возможность предварительного вычисления (например, коэффициент Танимото), это увеличение еще больше. Тем не менее, мы можем заметить, что графические процессоры по-прежнему имеют значительное преимущество, особенно с учетом производительности по отношению к стоимости и энергопотреблению. Мы также можем утверждать, что аналогичная масштабируемость производительности может наблюдаться при использовании нескольких графических процессоров.

Таблица 4

Ускорение двухъядерного процессора по сравнению с ускорением графического процессора.

9967 GTX4669

68

68

68 .44x

8

8

8

8

. расчет всех отпечатков пальцев Танимото, предложенный [14]. Подробности о нашем расчете коэффициента Танимото приведены в . Мы приняли 256-битный формат отпечатка пальца, а также подход таблицы поиска для подсчета битов, предложенный в [14].Несмотря на это сходство, мы получаем противоречивые результаты даже в базовом одноядерном процессорном времени. Более подробно, в [14] утверждается, что 2048 отпечатков пальцев обрабатываются одним потоком за 49,76 секунды, тогда как наша одноядерная реализация может обработать чуть большее количество отпечатков всего за долю времени (3200 отпечатков пальцев за 8,73 секунды). . В этом сценарии единственным значимым сравнением может быть оценка относительного ускорения графического процессора. Предполагая наличие 8192 отпечатков пальцев, одноядерные и графические реализации, предложенные в [14], имеют время выполнения 832.21 с и 2385.14 с . Этот результат соответствует коэффициенту замедления 832,21 с / 2385,14 с = 0,34 x . Для той же задачи мы ясно показали, как наш оптимизированный алгоритм графического процессора достигает среднего ускорения производительности в 206,68x, что на три порядка лучше, чем [14].

Таблица 5

Коэффициент Танимото для сравнения с работой, предложенной в [14].

Tanimoto на 51200 Fingerprints
GPU
модель
Precomp.
(ускорение)
Двухъядерный
(ускорение)
Базовый графический процессор
(ускорение)
Доп. GPU
(ускорение)

9400M 1,75x 4,15x 2,94x 5,87x
3,02x 139,17x 236,54x

Manhattan на 51200 дескрипторах
Модель GPU
Precomp.
(ускорение)
Двухъядерный
(ускорение)
Базовый графический процессор
(ускорение)
Доп. GPU
(ускорение)

9400M 1,76x 3,90x 6.03x
GTX460 1,82 354,58x 368,86x
368,86x
368,86x
368,86x
368.86x
90 164 174.53x 180.11x 199.87x 236.54x
Танимото
# Молекула
Отпечатки пальцев
Основание.CPU
(мс)
Оптимизированный GPU

(мс) (ускорение)

1600 2173 12
3200 8730 48
6400 40745 203
12800 168137 765 219.63x
25600 701303 3060 229.18x
51200 22 12292

5 Выводы

В этой статье мы показали, как химическое сходство оценка в крупномасштабной базе данных может использовать преимущества вычислений на графическом процессоре. Мы подробно расскажем о некоторых методах эффективного представления молекул и о коэффициентах подобия, обычно используемых в хемоинформатике.Мы представили общий алгоритм графического процессора для полного химического сравнения молекулярных отпечатков пальцев и молекулярных дескрипторов, введя необходимые оптимизации для минимизации обращений к глобальной памяти. Предыдущие работы, найденные в литературе [12, 13], сочетают хемоинформатику с вычислениями на GPU, но ни одна из них не содержит исчерпывающего освещения темы химического сходства. Мы протестировали предложенный алгоритм на различных экспериментальных установках, получив ускорение до 206 раз для отпечатков пальцев и до 328 раз для дескрипторов.Мы также сравнили наш расчет коэффициента Танимото с [14], превзойдя предыдущий результат на три порядка. Наконец, наша цель состояла в том, чтобы предоставить широкое доказательство концепции полезности архитектур графических процессоров в хемоинформатике, классе вычислительных задач, которые до сих пор не раскрыты. Следовательно, мы планируем исследовать другие методы хемоинформатики, которые могут использовать преимущества вычислений на GPU.

Благодарности

эта работа была поддержана грантами Национального института здравоохранения GM086145 и GM079804.

Footnotes

Международная конференция по вычислительной науке, ICCS 2011, Сингапур, 1-3 июня.

Ссылки

[1] Leach AR, Gillet VJ. Введение в химинформатику. Спрингер; 2005. [Google Scholar][2] Уиллет П., Барнард Дж. М., Даунс Г. М. Поиск химического сходства. Химическая информация и моделирование. 1998;38(6):983–996. [Google Scholar][3] Уилтон Д., Уиллет П., Лоусон К., Мюллер Г. Сравнение методов ранжирования для виртуального скрининга в программах поиска потенциальных клиентов.Химическая информация и моделирование. 2003; 2003(43):2. [PubMed] [Google Scholar][4] Джориссен Р.Н., Гилсон М.К. Виртуальный скрининг молекулярных баз данных с использованием машины опорных векторов. Химическая информация и моделирование. 2005;45(3):549–561. [PubMed] [Google Scholar][5] Бутина Д. Неконтролируемая кластеризация базы данных на основе отпечатков пальцев дневного света и подобия танимото: быстрый и автоматизированный способ кластеризации малых и больших наборов данных. Химическая информация и моделирование. 1999;39(4):747–750. [Google Scholar][7] Blum LC, Reymond JL.970 миллионов лекарствоподобных малых молекул для виртуального скрининга в базе данных химической вселенной gdb-13. Американское химическое общество. 2009;131(25):8732–8733. [PubMed] [Google Scholar]

[8] Nvidia Вычислительная архитектура cuda следующего поколения от Nvidia. Ферми, Технический документ.

[9] Манавский С.А., Валье Г. Совместимые с Cuda графические карты как эффективные аппаратные ускорители для выравнивания последовательности Смитуотермана. Биоинформатика БКМ. 2008;9(2):1–9. [Бесплатная статья PMC] [PubMed] [Google Scholar][10] Stone JE, Phillips JC, Freddolino PL, Hardy DJ, Trabucco LG, Schulten K.Ускорение приложений молекулярного моделирования с помощью графических процессоров. Вычислительная химия. 2007;28(16):2618–2640. [PubMed] [Google Scholar][11] Xu D, Williamson MJ, Walker RC. Достижения в моделировании молекулярной динамики биомолекул на графических процессорах. Годовые отчеты по вычислительной химии. 2010;6:2–19. [Google Scholar][12] Ляо К., Ван Дж., Вебстер Ю., Уотсон И.А. Машины опорных векторов с ускорением графического процессора для сбора высокопроизводительных данных скрининга. Химическая информация и моделирование.2009;49(12):2718–2725. [PubMed] [Google Scholar][13] Хак И.С., Панде В.С. Siml: Быстрый алгоритм simd для вычисления сходства химических выражений на графическом процессоре и процессоре. Химическая информация и моделирование. 2010;50(4):560–564. [Бесплатная статья PMC] [PubMed] [Google Scholar][14] Сачдева В., Фреймут Д.М., Мюллер С. Оценка индекса жаккара-танимото для многоядерных архитектур. Международная конференция по вычислительной науке.2009. стр. 944–953. [Google Scholar][15] Грант Дж. А., Галлардо М. А., Пикап Б. Быстрый метод сравнения формы молекул: простое применение гауссовского описания формы молекул.Вычислительная химия. 1996; 17 (14): 1653–1666. [Google Scholar][16] Кирк Д.Б., Хву В.В. Программирование массивно-параллельных процессоров. Морган Кауфманн; 2010. [Google Scholar][17] Ульманн Дж. Р. Алгоритм изоморфизма подграфов. АКМ. 1976; 23(1):31–42. [Google Scholar][18] Уэйл Н., Карипис Г. Пространства дескрипторов на основе ациклических подграфов для поиска и классификации химических соединений. Международная конференция IEEE по интеллектуальному анализу данных.2006. стр. 679–689. [Google Scholar][19] Баллестер П.Дж., Ричардс В.Г. Сверхбыстрое распознавание формы для поиска в базах данных соединений подобных молекулярных форм.Вычислительная химия. 2007;28(10):1711–1723. [PubMed] [Google Scholar][20] Армстронг М.С., Моррис Г.М., Финн П.В., Шарма Р., Моретти Л., Купер Р.И., Ричардс В.Г. Electroshape: быстрые расчеты молекулярного сходства с учетом формы, хиральности и электростатики. Компьютерный молекулярный дизайн. 2010;24(9):789–801. [PubMed] [Google Scholar][21] Ryoo S, Rodrigues CI, Baghsorkhi SS, Stone SS, Kirk DB, Hwu WW. Принципы оптимизации и оценка производительности приложений многопоточного GPU с помощью cuda.Материалы 13-го симпозиума ACM SIGPLAN по принципам и практике параллельного программирования. 2008. стр. 74–82. [Google Scholar]

Машинное обучение с Apache Beam и TensorFlow  | Облачный поток данных  | Облако Google

В этом пошаговом руководстве показано, как выполнять предварительную обработку, обучение и прогнозирование модель машинного обучения с использованием Apache Beam, Google Dataflow, и ТензорФлоу.

Для демонстрации этих концепций в этом пошаговом руководстве используется Образец кода молекул.Используя молекулярные данные в качестве входных данных, образец кода Molecules создает и обучает модель машинного обучения для прогнозирования молекулярной энергии.

Примечание: Образец кода Molecules использует TensorFlow API оценщиков. если ты используют TensorFlow Keras API, но хотите, чтобы ваш проект больше соответствовал этому пошаговому руководству, ты сможешь преобразовать вашу модель Keras в Estimator.

Затраты

В этом пошаговом руководстве потенциально используются оплачиваемые компоненты Google Cloud, в том числе один или несколько из:

  • Поток данных
  • Облачное хранилище
  • Платформа ИИ

Воспользуйтесь калькулятором цен для расчета стоимости на основе прогнозируемого использования.

Обзор

Образец кода Molecules извлекает файлы, содержащие молекулярные данные и подсчеты количество атомов углерода, водорода, кислорода и азота в каждой молекуле. Затем код нормализует счетчики до значений от 0 до 1 и передает значения в оценщик глубокой нейронной сети TensorFlow. Нейронная сеть Estimator обучает модель машинного обучения прогнозировать молекулярную энергию.

Пример кода состоит из четырех этапов:

  1. Извлечение данных ( средство извлечения данных.ру )
  2. Предварительная обработка ( preprocess.py )
  3. Обучение ( тренер/task.py )
  4. Предсказание ( предсказание.py )

Разделы ниже проходят через четыре этапа, но это пошаговое руководство больше внимания уделяется этапам, использующим Apache Beam и Dataflow: этап предварительной обработки и этап прогнозирования. На этапе предварительной обработки также используется библиотека TensorFlow Transform (широко известная как tf.Transform ).

На следующем изображении показан рабочий процесс примера кода Molecules.

Запустите пример кода

Чтобы настроить среду, следуйте инструкциям в файле README Репозиторий Molecules на GitHub. Затем запустите пример кода Molecules, используя один из предоставленные скрипты-оболочки, run-local или run-cloud . Эти скрипты автоматически запускают все четыре этапа примера кода (извлечение, предварительная обработка, обучение и предсказание).

Кроме того, вы можете запустить каждую фазу вручную, используя команды, представленные в разделы в этом документе.

Запускать локально

Чтобы запустить пример кода Molecules локально, запустите сценарий оболочки run-local :

  ./run-local
  

Выходные журналы показывают, когда сценарий запускает каждую из четырех фаз. (извлечение данных, предварительная обработка, обучение и прогнозирование).

Сценарий data-extractor.py имеет обязательный аргумент для количества файлов. Для простоты использования сценарии run-local и сценарии run-cloud по умолчанию имеют 5 файлов для этого аргумента.Каждый файл содержит 25 000 молекул. Запуск пример кода должен занять примерно 3-7 минут от начала до конца. Время для запуска зависит от процессора вашего компьютера.

Примечание: Скрипт run-local включает необязательные аргументы. См. README для получения информации о том, как использовать необязательные аргументы.

Запуск в облаке Google

Чтобы запустить пример кода Molecules в Google Cloud, запустите run-cloud сценарий обертки.Все входные файлы должны находиться в облачном хранилище.

Установите параметр --work-dir для корзины Cloud Storage:

  ./run-cloud --work-dir gs:///cloudml-samples/molecules
  

Примечание: Сценарий run-cloud включает необязательные аргументы. См. README для получения информации о том, как использовать необязательные аргументы.

Исходный код: data-extractor.py

Первым шагом является извлечение входных данных.Файл data-extractor.py извлекает и распаковывает указанные файлы SDF. На последующих этапах пример предварительно обрабатывает эти файлы и использует данные для обучения и оценки машины модель обучения. Файл извлекает файлы SDF из общедоступного источника и сохраняет их в подкаталоге внутри указанного рабочего каталога. рабочий каталог по умолчанию ( --work-dir ) — /tmp/cloudml-samples/molecules .

Сохраните извлеченные файлы данных локально:

  средство извлечения данных Python.py --max-файлы данных 5
  

Или сохраните извлеченные файлы данных в облачном хранилище местонахождение:

  WORK_DIR=gs://<имя вашей корзины>/cloudml-samples/molecules

python data-extractor.py --work-dir $WORK_DIR --max-data-files 5
  

Примечание. За хранение файлов в облачном хранилище расходы на ваш проект Google Cloud. Видеть Цены на облачное хранилище за дополнительной информацией.

Фаза 2: предварительная обработка

Исходный код: препроцесс .ру

Образец кода Molecules использует конвейер Apache Beam для предварительной обработки данных. Конвейер выполняет следующие действия предварительной обработки:

  1. Читает и анализирует извлеченные файлы SDF.
  2. Подсчитывает количество различных атомов в каждой из молекул в файлах.
  3. Нормализует счетчики до значений от 0 до 1 с помощью tf.Transform .
  4. Разделяет набор данных на набор данных для обучения и набор данных для оценки.
  5. Записывает два набора данных как объекты TFRecord .

Преобразования Apache Beam могут эффективно манипулировать отдельными элементами одновременно, но преобразования, которые требуют полного прохода набора данных, не могут быть легко выполнены с помощью только Apache Beam и лучше использовать tf.Transform. Из-за этого код использует преобразования Apache Beam для чтения и форматирования молекул, а также для подсчета атомов в каждой молекуле. Затем код использует tf.Transform для поиска глобального минимальное и максимальное количество для нормализации данных.

На следующем изображении показаны этапы конвейера.

Примечание: Некоторая логика в конвейере предварительной обработки ( preprocess.py ) совместно используется конвейером, ответственным за создание прогнозы ( предсказания.py ). Чтобы избежать дублирования кода, эта общая логика находится в файлах pubchem/pipeline.py и pubchem/sdf.py . Управление зависимостями конвейера Apache Beam поощряет размещение импортированных файлы в отдельный модуль.

Применение преобразований на основе элементов

Предварительный процесс .py создает конвейер Apache Beam.

См. код tensorflow_transform/beam/impl.py.

Затем код применяет преобразование feature_extraction к конвейеру.

Конвейер использует SimpleFeatureExtraction в качестве feature_extraction трансформировать.

Преобразование SimpleFeatureExtraction , определенное в pubchem/pipeline.py , содержит серию преобразований, которые управляют всеми элементами независимо. Сначала код анализирует молекулы из исходного файла, затем форматирует молекул в словарь свойств молекул и, наконец, подсчитывает атомы в молекуле. Эти подсчеты являются функциями (входными данными) для машинного обучения. модель.

Преобразование чтения beam.io.Read(pubchem.ParseSDF(data_files_pattern)) считывает SDF-файлы из пользовательского источника.

Пользовательский источник с именем ParseSDF определен в pubchem/pipeline.py . ParseSDF расширяет FileBasedSource и реализует функцию read_records , которая открывает извлеченные файлы SDF.

При запуске образца кода Molecules в Google Cloud несколько рабочие (ВМ) может одновременно читать файлы. Чтобы два работника не читали одно и то же содержимое файлов, каждый файл использует range_tracker .

Конвейер группирует необработанные данные в разделы необходимой информации для следующих шагов. Каждый раздел в проанализированном файле SDF хранится в словарь (см. pipe/sdf.py ), где ключами являются имена разделов и значения — это необработанное содержимое строки соответствующего раздела.

Примечание: Образец кода Molecules извлекает только несколько особенности молекул. Чтобы увидеть более сложное извлечение признаков, см. этот проект.

Код применяет beam.ParDo(FormatMolecule()) к конвейеру. ПарДо применяет DoFn с именем FormatMolecule к каждой молекуле. Формат Молекула дает словарь форматированных молекул. Следующий фрагмент является примером элемента в выводе PCollection:

  {
  «атомы»: [
    {
      'atom_atom_mapping_number': 0,
      'атом_стерео_четность': 0,
      'atom_symbol': у'О',
      «заряд»: 0,
      'exact_change_flag': 0,
      'h0_обозначение': 0,
      'водород_счетчик': 0,
      'inversion_retention': 0,
      'массовая_разность': 0,
      'stereo_care_box': 0,
      «валентность»: 0,
      'х': -0.0782,
      'у': -1,5651,
      «г»: 1,3894,
    },
    ...
  ],
  «облигации»: [
    {
      'бонд_стерео': 0,
      'bond_topology': 0,
      'тип_связи': 1,
      'первый_атомный_номер': 1,
      'реагирующий_центр_статус': 0,
      'второй_номер_атома': 5,
    },
    ...
  ],
  '': ['3\n'],
  ...
  '': ['19.4085\n'],
  ...
}
  

Затем код применяет beam.ParDo(CountAtoms()) к конвейеру. DoFn CountAtoms суммирует количество атомов углерода, водорода, азота и кислорода каждая молекула имеет. CountAtoms выводит PCollection функций и меток. Вот пример элемента в выходной PCollection:

  {
  «ИД»: 3,
  «Всего С»: 7,
  «ВсегоЧ»: 8,
  «Всего0»: 4,
  «Всего N»: 0,
  «Энергия»: 19.4085,
}
  

Затем конвейер проверяет входные данные. ValidateInputData DoFn проверяет что каждый элемент соответствует метаданным, указанным в input_schema . Эта проверка гарантирует, что данные находятся в правильном формате, когда они загружаются в TensorFlow.

Применение полнопроходных преобразований

В примере кода Molecules используется Глубокий регрессор нейронной сети, чтобы делать прогнозы. Генерал рекомендуется нормализовать входные данные перед их подачей в ML модель. Конвейер использует tf.Transform для нормализации количества каждого атома к значения от 0 до 1. Чтобы узнать больше о нормализации входных данных, см. см. масштабирование объектов.

Для нормализации значений требуется полный проход по набору данных с записью минимальное и максимальное значения. Код использует tf.Transform для прохождения всего набор данных и применять полнопроходные преобразования.

Чтобы использовать tf.Transform, код должен предоставлять функцию, содержащую логику преобразование для выполнения над набором данных. В preprocess.py код использует AnalyzeAndTransformDataset Преобразование, предоставленное tf.Transform. Узнать больше о как пользоваться тф.Трансформировать.

В preprocess.py используется функция feature_scaling normalize_inputs , который определен в pubchem/pipeline.py . Функция использует tf.Transform функция scale_to_0_1 для нормализации счетчиков до значений от 0 до 1.

Нормализация данных вручную возможна, но если набор данных большой, быстрее использовать Dataflow.Использование потока данных позволяет конвейер для запуска на нескольких рабочих процессах (ВМ) по мере необходимости.

Разделение набора данных

Затем конвейер preprocess.py разделяет один набор данных на два наборы данных. Он выделяет примерно 80% данных для использования в качестве обучения. данные, и примерно 20% данных будут использоваться в качестве данных для оценки.

Запись вывода

Наконец, препроцесс .Конвейер py записывает два набора данных (обучающий и оценочный) с использованием преобразования WriteToTFRecord .

Запустить конвейер предварительной обработки

Запустить конвейер предварительной обработки локально:

  Python preprocess.py
  

Или запустите конвейер предварительной обработки в потоке данных:

  PROJECT=$(проект gcloud config get-value)
WORK_DIR=gs://<имя вашей корзины>/cloudml-samples/molecules
предварительная обработка питона.ру \
  --проект $ПРОЕКТ \
  --runner DataflowRunner \
  --temp_location $WORK_DIR/beam-temp \
  --setup_file ./setup.py \
  --work-dir $WORK_DIR
  

Примечание. Работающие конвейеры потока данных требуют оплаты ваш проект Google Cloud. Дополнительные сведения см. в разделе Цены на Dataflow.

После запуска конвейера вы можете просмотреть ход выполнения конвейера в Интерфейс мониторинга потока данных:

Фаза 3: Обучение

Исходный код: трейнер/задача.ру

Напомним, что в конце этапа предварительной обработки код разделил данные на два набора данных (обучение и оценка).

Образец использует TensorFlow для обучения модели машинного обучения. Тренер /task.py файл в образце кода Molecules содержит код для обучения модели. Основная функция Trainer/task.py загружает данные, которые были обработаны в этап предварительной обработки.

Estimator использует обучающий набор данных для обучения модели, а затем использует оценку набор данных, чтобы убедиться, что модель точно предсказывает молекулярную энергию с учетом некоторого свойств молекулы.

Вы можете просмотреть сведения о задании обучения в TensorBoard, выполнив:

тензорная доска --logdir $WORK_DIR/модель
 

Получите доступ к результатам в браузере по адресу localhost:6006 .

Узнайте больше об обучении модели машинного обучения.

Тренируйте модель

Локальное обучение модели:

  тренер Python/task.py

# Чтобы получить путь обученной модели
EXPORT_DIR=/tmp/cloudml-samples/molecules/model/export/final
MODEL_DIR=$(ls -d -1 $EXPORT_DIR/* | sort -r | head -n 1)
  

Или обучите модель на платформе AI:

  набор конфигурации gcloud вычисление/регион $REGION
  
  JOB="cloudml_samples_molecules_$(дата +%Y%m%d_%H%M%S)"
BUCKET=gs://<имя вашего сегмента>
WORK_DIR=$BUCKET/cloudml-образцы/молекулы
gcloud ai-platform отправить обучение $JOB \
  --module-name тренер.задача \
  --package-path тренер \
  --staging-bucket $BUCKET \
  --runtime-версия 1.13 \
  --поток-журналы \
  -- \
  --work-dir $WORK_DIR

# Чтобы получить путь к обученной модели:
EXPORT_DIR=$WORK_DIR/модель/экспорт
MODEL_DIR=$(gsutil ls -d $EXPORT_DIR/* | sort -r | head -n 1)
  

Примечание. Создание прогнозов с использованием AI Platform влечет за собой расходы на ваш проект Google Cloud. Видеть Платформа ИИ ценообразование за дополнительной информацией.

Фаза 4: прогноз

Исходный код: прогноз.ру

После того, как Estimator обучит модель, вы можете предоставить модели входные данные, и она будет делать прогнозы. В образце кода Molecules конвейер в predict.py отвечает за предсказания. Конвейер может действовать как пакетный конвейер или потоковый конвейер.

Код конвейера одинаков для пакетной и потоковой передачи, за исключением взаимодействия источника и стока. Если конвейер работает в пакетном режиме, он считывает входные файлы из пользовательского источника и записывает выходные прогнозы в виде текстовых файлов в указанный рабочий каталог.Если конвейер работает в потоковом режиме, он считывает входные молекулы, по мере их поступления из темы Pub/Sub. Конвейер записывает выходные прогнозы, когда они будут готовы, в другую тему Pub/Sub.

На следующем изображении показаны шаги в конвейерах прогнозирования (пакетный и потоковое).

В predict.py код определяет конвейер в функции run :

Код вызывает функцию run со следующими параметрами:

Во-первых, код проходит pubchem.SimpleFeatureExtraction (источник) преобразовывать как преобразование feature_extraction . Это преобразование, которое было также используется на этапе предварительной обработки, применяется к конвейеру:

Преобразование считывается из соответствующего источника на основе конвейера режим выполнения (пакетный или потоковый), форматирует молекулы и подсчитывает разные атомы в каждой молекуле.

Next, beam.ParDo(Predict(…)) применяется к конвейеру, который выполняет предсказание молекулярной энергии. Predict , переданный DoFn , использует заданный словарь входных функций. (число атомов), чтобы предсказать молекулярную энергию.

Следующим преобразованием, примененным к конвейеру, является beam.Map(lambda result: json.dumps(result)) , который принимает результат прогнозирования словарь и сериализует его в строку JSON.

Наконец, вывод записывается на приемник (либо в виде текстовых файлов на рабочую каталог для пакетного режима или в виде сообщений, опубликованных в теме Pub/Sub для потоковый режим).

Пакетные прогнозы

Пакетные прогнозы оптимизированы для пропускной способности, а не задержки. Партия прогнозы работают лучше всего, если вы делаете много прогнозов и можете дождаться всех из них закончить до получения результатов.

Запуск конвейера прогнозирования в пакетном режиме

Запустите конвейер пакетного прогнозирования локально:

  # Для простоты будем использовать те же файлы, что и для обучения
питон предсказать.py \
  --model-dir $MODEL_DIR \
  партия \
  --inputs-dir /tmp/cloudml-samples/молекулы/данные \
  --outputs-dir /tmp/cloudml-samples/молекулы/предсказания
  

Или запустите конвейер пакетного прогнозирования в потоке данных:

  # Для простоты будем использовать те же файлы, что и для обучения
PROJECT=$(проект получения значения конфигурации gcloud)
WORK_DIR=gs://<имя вашей корзины>/cloudml-samples/molecules
питон предсказывает.ру \
  --рабочий-каталог $WORK_DIR \
  --model-dir $MODEL_DIR \
  партия \
  --проект $ПРОЕКТ \
  --runner DataflowRunner \
  --temp_location $WORK_DIR/beam-temp \
  --setup_file ./setup.py \
  --inputs-dir $WORK_DIR/данные \
  --outputs-dir $WORK_DIR/предсказания
  

Примечание. Работающие конвейеры потока данных требуют оплаты ваш проект Google Cloud. Дополнительные сведения см. в разделе Цены на Dataflow.

После запуска конвейера вы можете просмотреть ход выполнения конвейера в Интерфейс мониторинга потока данных:

Потоковые прогнозы

Потоковые прогнозы оптимизированы для задержки, а не пропускной способности.Потоковое прогнозы работают лучше всего, если вы делаете спорадические прогнозы, но хотите получить результаты как можно скорее.

Служба прогнозирования (конвейер потокового прогнозирования) получает вводит молекулы из темы Pub/Sub и публикует вывод (прогнозы) в другую тему Pub/Sub.

Создать входную тему Pub/Sub:

  темы gcloud pubsub создают молекулы-входы
  

Создать выходную тему Pub/Sub:

  темы gcloud pubsub создают молекулы-предсказания
  

Локальный запуск конвейера прогнозирования потоковой передачи:

  # Запустить на терминале 1
PROJECT=$(проект получения значения конфигурации gcloud)
питон предсказывает.ру \
  --model-dir $MODEL_DIR \
  поток \
  --проект $ПРОЕКТ
  --inputs-topic входы-молекулы \
  --outputs-topic molecules-predictions
  

Или запустите конвейер потокового прогнозирования в потоке данных:

  # Запустить на терминале 1
PROJECT=$(проект получения значения конфигурации gcloud)
WORK_DIR=gs://<имя вашей корзины>/cloudml-samples/molecules
питон предсказать.py \
  --рабочий-каталог $WORK_DIR \
  --model-dir $MODEL_DIR \
  поток \
  --проект $ПРОЕКТ
  --runner DataflowRunner \
  --temp_location $WORK_DIR/beam-temp \
  --setup_file ./setup.py \
  --inputs-topic входы-молекулы \
  --outputs-topic molecules-predictions
  

После того, как у вас есть служба прогнозирования (конвейер потокового прогнозирования) работает, вам нужно запустить издатель, чтобы отправить молекулы в службу прогнозирования и подписчик для прослушивания результатов прогнозирования. Образец кода Molecules предоставляет услуги издателя ( publisher.py ) и подписчика ( subscriber.py ).

Издатель анализирует файлы SDF из каталога и публикует их на входах тема.Подписчик прослушивает результаты прогнозирования и регистрирует их. За Для простоты в этом примере используются те же файлы SDF, что и на этапе обучения.

Примечание: Вам нужно запускать их как разные процессы одновременно, поэтому вам понадобится другой терминал для запуска каждой команды. Не забудьте активировать virtualenv на каждом терминале.

Запустить абонента:

  # Запустить на терминале 2
подписчик Python.py \
  --проект $ПРОЕКТ \
  --topic молекулы-предсказания
  

Запустить издатель:

  # Запустить на терминале 3
издатель питона.ру \
  --проект $ПРОЕКТ \
  --topic входы молекул \
  --inputs-dir $WORK_DIR/данные
  

После того, как издатель начнет анализировать и публиковать молекулы, вы начнете видеть предсказания от подписчика.

Очистка

После того, как вы закончите запуск конвейера прогнозов потоковой передачи, остановить свой конвейер для предотвращения взимания платы.

Что дальше

Оценка активности студентов педагогического колледжа как инструмент учебной активизации | Шестакова

Всего просмотров : 516

Оценка деятельности студентов педагогического колледжа как инструмент учебной активизации

Филиалы
  • Пермский государственный национальный исследовательский университет, Соликамский государственный педагогический институт, Пермь, Российская Федерация
Аннотация

Предпосылки/Цель: Целью статьи является анализ влияния оценочной деятельности студентов педагогического колледжа на повышение учебной активности. Методы: Выводы основаны на анализе научных академических исследований. Для выявления влияния оценочной активности студентов на повышение уровня их учебной активности применялся анкетный опрос. Выводы: Определены навыки оценивания будущих педагогов в рамках ФГОС ВУЗов; рассмотрены различные точки зрения на определение понятия активизации, рассмотрена оценочная деятельность студентов как действенное активационное средство, ее аспекты, предмет и этапы.На основе анализа результатов теоретической и экспериментальной работы выделены основные инструменты управления оцениванием, такие как: самооценка и взаимооценка, формы воспитательной работы соотнесены с оценочной деятельностью студентов. Проведенная экспериментальная работа позволила выявить условия, при которых использование самооценки и взаимного оценивания будет эффективным для активизации образовательного процесса. Виды учебной деятельности были связаны с активностью студента.Определена роль оценивания деятельности студентов педагогического колледжа. Проведен анализ для определения влияния оценочной активности студентов на повышение активации. Приложения/Усовершенствования: Научная новизна исследования заключается в выявлении оценочных умений будущих учителей в рамках ФГОС, определении основных инструментов управления оценкой как средства совершенствования образовательного процесса в вузе, соотнесении форм образовательной работать с оценочной деятельностью учащихся.


Ключевые слова

Активация, самооценка, оценивающая деятельность учащихся.


Полный текст:
| (просмотров PDF: 309)
Каталожные номера

  • Коробий ЕБ. Активация и формирование мотивации упражнения. Всемирный журнал прикладных наук. 2014; 29(9):1187–90.
  • Гордон Дж., Халаш Г., Кравчик М., Лени Т.Ключевые компетенции в Европе: открывая двери для обучения на протяжении всей жизни. CASE — Центр социально-экономических исследований: Варшава; 2009.
  • Хутмахер В. Ключевые компетенции для Европы. Доклад Бернского симпозиума, Швейцария, Совет по культурному сотрудничеству (CDCC). Среднее образование для Европы. Страсбург; 1997.
  • Микешина Л.А. Чешский педагог, гуманист и философ. Новая философская энциклопедия. Москва: Мысль; 2010.
  • Мандель БР. Современная педагогическая психология.МоскваБерлин: Директ-Медиа; 2015.
  • Абрамов ЯВ. Иоганн Генрих Песталоцци. Его жизнь и педагогическая деятельность. Москва: Остеон-Пресс; 2015.
  • Шлейхер, А. Подготовка учителей и развитие руководителей школ для 21 века, Уроки со всего мира; 2012.
  • Рогачева Е.Ю. Педагогика Джона Дьюи в ХХ веке: кросскультурный контекст: монография. Владимир: Издательство ВГПУ; 2005.
  • Эстетика Дьюи и современное нравственное воспитание [Интернет].[Цитировано 27 февраля 2016 г.]. Доступно по адресу: http://docs.lib.purdue. edu/cgi/viewcontent.cgi?article=1236&context=eandc.
  • Федорова Н.М. Становление и развитие советской школы в 1918-1931 гг. Кандидатская диссертация по педагогике. Санкт-Петербург; 2001.
  • Цветкова В.Е. Развитие форм и методов преподавания естествознания в отечественной школе в 20-е годы 20 века. Кандидатская диссертация по педагогике. Москва; 2001.
  • Ситаров В.А. Дидактика: пособие для студентов педагогических вузов.Москва: Издательский центр «Академия»; 2004.
  • Хуторской А.В. Дидактическая эвристика. Теория и технология творческого обучения. Москва: Издательство МГУ; 2003.
  • Шестакова Л.Г. Особенности формирования стиля нелинейного мышления школьников как исторический и научный материал. Американский журнал педагогики и образования. 2013: 29–32.
  • Буш М., Мотт Дж. Преобразование обучения с помощью технологий, ориентированных на учащегося. Гибкость контента и инструментов, а также сетевые эффекты.2009 март: 1–18.
  • Использование веб-квестов для конструктивистского обучения/B. Мартин [Интернет]. [Цитировано 27 февраля 2016 г.]. Доступно по адресу: http://members.tripod.com/drwilliampmartin/introduction.html.
  • Рихтер ТВ. Возможности дистанционных образовательных технологий для развития познавательной самостоятельности студентов при освоении информатики в педагогических вузах. Американский журнал педагогики и образования. 2013: 21–5.
  • Активизация обучения в экономическом образовании [Интернет].[Цитировано 10 февраля 2016 г.]. Доступно по адресу: http://lybs.ru/index-15767.htm.
  • Раимкулова А.С. Модель формирования профессиональной компетентности будущего учителя в условиях активизации познавательной деятельности школьников. Современные научные вызовы. 2015: 67–81.
  • Постек С., Ледзинска М., Чарковски Ю. Психолого-педагогические проблемы дистанционного обучения взрослых. Проблемы образования в 21 веке. 2010 г.; 22:1–10.
  • Кальянов АЮ. Активизация познавательной деятельности студентов при изучении дисциплин экономического блока в педагогическом колледже.Университет 21 века: научное измерение. Материалы научной конференции профессоров, преподавателей, аспирантов, магистров и заочников ТГПУ им. Л. Толстого. ТГПУ: ​​Тула; 2011. с. 312–15.
  • Субботко А.Н. Формирование системы оценивания деятельности у будущего учителя. Кандидат наук. Диссертация по педагогическим наукам: 13.00.08. БГУ Пресс: Брянск; 2006.
  • Абдулла Ф. Измерение качества услуг в сфере высшего образования: сравнение трех частей. Международный журнал исследований и методов в образовании.2006 апрель; 29(1):71–89.
  • Крамер К.М., Алексич Л.Р. Студенческие оценки преподавателей колледжей: выявление источников предвзятости. Канадский журнал высшего образования. 2000 г.; 30(2):143–64.
  • Бейкер Ф.Б., Ким С.Х. Теория отклика элемента: методы оценки параметров. 2-е издание. КПР Пресс; 2004.
  • Блум Б.С., Хастинг Дж.Т., Мадаус Г.Ф. Справочник по формативной и итоговой оценке обучения учащихся. McGrawHill: Нью-Йорк; 1971.
  • Гласс Г.В., Хопкинс К.Д.Статистические методы в образовании и психологии. 3-е издание. Пирсон: Бостон; 2008.
  • Ву М., Адамс Р. Применение модели Расе к психосоциальным измерениям: практический подход. Образовательные измерительные решения: Мельбурн; 2007.
  • Дам Л. Оценка автономного обучения. Синклер, Автономия учащегося, Автономия учителя Будущие направления. Pearson Education Limited: Харлоу; 2000. с. 48–59.
  • Развитие ответственных и самостоятельных учащихся: ключ к мотивации учащихся.американская психологическая ассоциация [Интернет]. [Цитировано 28 ноября 2012 г.]. Доступно по адресу: http://www.apa.org/education/k12/learners.aspx.
  • Пачина АГ. Ценностно-оценочная деятельность учителя как условие формирования ценностного отношения учащихся к учебной деятельности. Современные вызовы науки и образования. 2015.
  • Морейра А. Проблемы исследований в области открытого и дистанционного обучения. Восьмой исследовательский семинар EDEN, Оксфорд, Соединенное Королевство; 2014 окт.
  • Бьярс-Уинстон А., Гутьеррес Б., Топп С., Карнес М. Интеграция теории и практики для увеличения разнообразия научной рабочей силы: основа для карьерного роста при подготовке аспирантов. CBE Образование в области наук о жизни. 2011 г.; 10(4):357–67.

Рефбеки

  • В настоящее время рефбеков нет.


Эта работа находится под лицензией Creative Commons Attribution 3.0 License.

Подчеркивая дистанционное обучение в Техасском технологическом институте | Техасский технологический институт сегодня

Национальная неделя дистанционного обучения — ноябрь.9-13, и пандемия COVID-19 ясно показали, что дистанционное обучение жизненно важно. Техасский технический университет предлагает надежные программы для виртуального и дистанционного обучения.

Когда коронавирус охватил страну в марте, университеты, колледжи и школы США были вынуждены перевести все обучение в онлайн. Тем не менее, Техасский технический университет уже много лет предлагает различные программы для виртуальных учащихся.

С 9 по 13 ноября проводится Национальная неделя дистанционного обучения (NDLW) — неделя, созданная для повышения осведомленности и понимания дистанционного обучения. обучение, в том числе K-12, высшее образование, корпоративное и военное, признавая лидеры и лучшие практики в этой области — мы выделяем все удивительные грани отдела электронного обучения и академического партнерства Texas Tech.

Электронное обучение по всему миру и региональные сайты

Worldwide eLearning — это ориентированная на колледжи область электронного обучения и академического партнерства, предлагающая более 80 полностью онлайн или гибридных программ на получение степени. Учащиеся любого возраста имеют право получить степень бакалавра, магистра или доктора с помощью Worldwide eLearning. Он также предлагает программы подготовки к сертификации и сертификаты выпускников.

Мелани Харт

«Техасский технологический институт отличается от многих других университетов тем, что мы не привлекаем разработка нашего курса, — сказала Мелани Харт, вице-проректор по электронному обучению и академическому партнерству. — Мы гордимся тем, что наши высококачественные классы создаются нашими замечательными преподавателями в сотрудничестве с нашими учебными команда дизайнеров.»

Студенты также могут посещать очные занятия в одном из девяти региональных центров Texas Tech:
• Техасский технический университет в Центре высшего образования Коллина, расположенный в МакКинни
• Техасский технический университет в Эль-Пасо
• Техасский технический университет в Фредериксбурге
• Техасский технический университет в Хайленд-Лейкс, расположенный к северо-западу от Остина,
• Техасский технический университет в кампусе Хилл-колледжа в округе Джонсон в Клеберне,
• Техасский технический университет, перекресток
• Техасский технический университет в Рокуолле, расположенный по адресу Dr.Колледж и карьерная академия Джина Бертона в Рокуолле,
• Техасский технический университет в Уэйко, расположенный в муниципальном колледже Макленнана в Уэйко,
• Техасский технический университет в Остин-колледже, расположенный на территории кампуса Остин-колледжа в Шермане.

Степени, полученные в региональных центрах Texas Tech, равны дипломам, полученным в кампусе. в Лаббоке. Другими словами, диплом студента, обучающегося на дистанционном обучении, будет выглядеть так же. как диплом человека, окончившего университетские программы в Лаббоке.

ТТУ К-12

ТТУ К-12 — это утвержденный государством онлайн-детский сад до 12-го класса, который выполнил потребности студентов более 25 лет.

Джастин Лаудер

ТТУ К-12 начал свою деятельность в 1993 году как «Округ особого назначения», предназначенный для помощи учащимся, образовательные потребности не удовлетворялись должным образом традиционными школьными округами.С того времени, он вырос, чтобы обслуживать студентов в США и более чем в 70 странах мира.

ТТУ К-12 может похвастаться строгим учебным планом, который позволяет студентам работать на опережение, составлять неудачные кредиты и достичь своих целей, где бы они ни находились. Он предлагает открытую регистрацию тестирование решений и очная программа получения диплома средней школы Техаса, которая завершается церемонией вручения дипломов в кампусе Техасского технологического института.

Курсы средней школы

TTU K-12 также одобрены Национальным студенческим спортом. Ассоциация (NCAA). Среди известных выпускников ТТУ К-12 актер Джесси Племонс и фигуристка сборной США Эшли Кейн.

«Texas Tech является мировым лидером в области онлайн-обучения на всех уровнях, и NDLW отмечает дистанционное обучение», — сказал Джастин Лаудер, помощник проректора по электронному обучению и академическому партнерству и временно исполняющий обязанности суперинтенданта. для ТТУ К-12.«На этой неделе электронное обучение в Техасском технологическом институте проведет несколько вебинаров, демонстрирующих лучшие практики онлайн-обучения».

Чтобы ознакомиться с расписанием NDLW Техасского технологического института, посетите страницу eLearning в Facebook.


Узнайте о новостях, экспертах и ​​идеях Texas Tech на ресурсах Texas Tech Today Media Resources или подпишитесь на нас в Twitter.

теги: Feature Stories, Stories, eLearning

4.6.1 Дистанционное обучение | Библиотека политик | Технологический институт Джорджии

GTPE предоставляет работающим специалистам возможность записаться на курсы Технологии Джорджии, которые можно применить для получения степени магистра в области аэрокосмической техники, строительства зданий и комплексного управления объектами, гражданского строительства, электротехники и вычислительной техники, инженерии окружающей среды, промышленности. и системная инженерия, машиностроение, медицинская физика и исследование операций, или могут быть использованы для профессионального развития.Программа дистанционного обучения Технологического института Джорджии позволяет людям развиваться профессионально и оставаться на переднем крае своей специальности. GTPE предоставляет кредитные и некредитные курсы на расстоянии через Интернет (видео по запросу), спутниковую доставку, телеконференции, общегосударственные сети, CD-ROM и DVD, а также микроволновую передачу.

Услуги

GTPE должны использоваться для регистрации и отслеживания участия во всех кредитных курсах уровня магистра Технологического института Джорджии, предлагаемых дистанционно работающим специалистам либо для академического кредита, либо для профессионального развития.Услуги GTPE также можно использовать для других дистанционных курсов Технологического института Джорджии. GTPE обеспечивает различные уровни производственной поддержки в зависимости от потребностей академического подразделения.

Распределение доходов
Плата за обучение на магистерских курсах Технологического института Джорджии, предлагаемых дистанционно, утверждается Попечительским советом Джорджии и одинакова для всех участников, независимо от статуса резидента. Процент, определенный проректором, от платы за обучение, полученной за курс дистанционного обучения, передается академическому отделу преподавателя, предлагающего курс.Подразделение может использовать эти средства по своему усмотрению, но рекомендуется разрешить преподавателю, ведущему курс, использовать средства в знак признания дополнительной работы, необходимой для обслуживания студентов, обучающихся дистанционно. Оставшаяся часть платы за обучение остается у GTPE для покрытия расходов на проведение и поддержку курса.

Распределение доходов от других дистанционных мультимедийных курсов, не имеющих коммерческой лицензии, должно определяться до предложения курса и должно быть соразмерно объему выполненной работы и риску, взятому на себя каждой вовлеченной организацией.Курсы с коммерческой лицензией подпадают под действие политики GIT в отношении интеллектуальной собственности.

Учебное пособие — Эффективное дистанционное высшее образование для взрослых.

Онлайн-обучение. Советы по эффективному домашнему обучению.

 

Международный университет Бирчем

Учебное пособие

 

В пособии по домашнему обучению BIU объясняется наш эффективный педагогический подход, рассказывается, как организовать учебу, как мы проводим экзамены, а также содержится множество полезных советов по онлайн-обучению.Подробнее…

 

 

 

Мы считаем, что вы достаточно зрелы, чтобы не стесняться следовать рекомендациям по домашнему обучению Международного университета Бирчам или выбирать свой собственный метод домашнего обучения, если вы соответствуете требованиям, изложенным в программе дистанционного обучения. Какой бы метод вы ни выбрали, следите за тем, чтобы не разрушить умственные процессы обучения и усвоения, изложенные в педагогике заочного обучения BIU. Больше информации…

 

Международный университет Бирчем устанавливает некоторые каналы связи, документов и консультаций с целью оптимизации услуг и производительности, предлагаемых студентам. По нашему мнению, это лучший способ обеспечить скорость и качество всей вашей программы обучения. Тем не менее, мы не хотим, чтобы ваше домашнее изучение стало безличным или отстраненным опытом. По этой причине мы напоминаем вам, что мы здесь, чтобы позаботиться о любом вопросе, который может у вас возникнуть.

 

Все вопросы, связанные с предоставлением письменных заданий, сомнения относительно понимания учебника, уровня знаний и т. д., а также любые административные процедуры следует адресовать в офис вашего Международного университета Бирчам. Этот последний будет координировать решение ваших вопросов с соответствующим членом команды инструктора. Подробнее…

 

Несмотря на то, что свободное расписание занятий на дому оказывается лучшим выбором, Международный университет Бирчам может предоставить вам фиксированное расписание занятий на дому, чтобы помочь вам организовать учебу путем установления еженедельных целей.Подробнее…

 

Международный университет Бирчам верит в самоорганизацию процесса обучения на дому.

 

 

 

Эффективное дистанционное обучение взрослых Высшее образование.

 

Эффективное онлайн-обучение: ключ к интеграции «ноу-хау» любой специализации в нашем сознании лежит в понимании того, ЧТО и КАК мы изучаем.

 

ЧТО: Учебники, специально отобранные и контролируемые Международным университетом Бирчем, составляют основной элемент каждого онлайн-курса обучения.Эти книги выбраны за их ясное, интересное и глубокое содержание. Они поощряют критическое мышление и практическое применение полученных знаний. BIU использует лучший доступный список опубликованных учебников, пытаясь достичь прогнозируемых результатов онлайн-обучения по каждой программе дистанционного обучения. Подробнее…

 

КАК: Необходимо структурировать эффективный подход к онлайн-обучению и применить его к выбранным учебникам, чтобы преобразовать исходный материал из учебника в полезную обработанную информацию.Педагогика BIU является хорошим примером того, как достичь этой цели. Подробнее…

 

Начало программы обучения

Написание отчетов является ключевым элементом в Международном университете Бирчам, как это часто бывает в профессиональной жизни. Требования программы в первую очередь состоят в изучении всех назначенных учебников и написании отчетов по этим чтениям в соответствии с рекомендациями, описанными в руководстве по домашнему обучению BIU. После того, как вы получили все инструкции, руководства по программе, учебники и другие учебные материалы; Вам решать, как организовать свое время для выполнения заданий, чтобы получить степень.Офисы Международного университета Бирчам всегда готовы ответить на ваши вопросы и поддержать вас в процессе обучения.

 

Как делать отчеты? Подробнее…
Как сделать проект или дипломную работу? Подробнее…

 

Продолжительность: Для программы из 21 кредита расчетное время завершения составляет 21 неделю. Для 45 кредитов предполагаемое время завершения составит 45 недель и так далее. Расчеты приблизительны.Продолжительность каждой программы дистанционного обучения рассчитывается на основе в среднем 15 часов обучения в неделю. Это также зависит от количества подтвержденных кредитов из предыдущих знаний и уровня приверженности учебе. Подробнее…

 

Международный университет Бирчам предлагает серию кратких, но эффективных советов по онлайн-обучению, которые могут помочь улучшить интеллектуальные способности. Вам предлагается адаптировать эти советы по онлайн-обучению к тому, что вы считаете наиболее подходящим для ваших обычных привычек домашнего обучения.Подробнее…

 

Важно то, что вы знаете, а не то, сколько вы должны изучить или как вы приобрели эти знания. Университет дистанционного обучения должен облегчать жизнь, а не создавать препятствия.

Хочешь попробовать? Подробнее…

 

Основы любого эффективного онлайн-обучения: чтение, понимание и запоминание.

 

Стенограмма

BIU имеет межправительственную аккредитацию и соответствует международным стандартам США «Общепринятая практика аккредитации» (GAAP), Великобритании «Рамки квалификаций высшего образования» (FHEQ), ЕС «Европейская рамка квалификаций» (EQF,) « Европейская система перевода и накопления кредитов» (ECTS), «Руководящие принципы трансграничного высшего образования» ООН и «Признание квалификаций высшего образования» ООН (статьи 36-37).Подробнее…

 

В Международном университете Бирчам мы хотим, чтобы вы не просто поступили, а получили высшее образование, получили заслуженную программу дистанционного обучения и достигли своих целей.

Добавить комментарий

Ваш адрес email не будет опубликован.