четверг, 24 апреля 2008 г.

Инфраструктура

Презентация (англ.) Джефа Дина о сегодняшнем состоянии инфраструктуры сервисов Google и планах компании по её развитию.

Исходя из философии, что и надёжная техника тоже подвержена отказам, в основе используются следующие решения:
  • ПК-серверы;
  • низкобюджетные (low-end) дисковые подсистемы и активное сетевое оборудование;
  • Linux;
  • свой базовый софт.
Софт это распределённые высоконадёжные сервисы:
  • GFS - файловая система Google (более 200 кластеров, с более чем 5000 узлами и боле 5 Петабайтами дискового пространства);
  • BigTable - база данных Google;
  • MapReduce - среда параллельных вычислений.
В будущем планируется:
  • расширить понятие распределённости данных не только внутри, но и между центрами данных;
  • обеспечить для 99% запросов отклик в пределах 50 мс;
  • сделать так чтобы копии набора данных (как минимум 5-ти, сейчас их 3) распределялись между центрами данных следующим образом: по два в Европе и Америке и один в Азии.

Комментариев нет:

Отправить комментарий