НОУ ИНТУИТ | Разработка компиляторов. Лекция 7: Восходящие анализаторы

Учитесь и получайте официальные документы БЕСПЛАТНО. Вы можете поддержать наш проект.

Регистрация Вход

Твой путь к знаниям!

Опубликован: 23.07.2006 | Доступ: свободный | Студентов: 2241 / 912 | Оценка: 4.28 / 4.17 | Длительность: 21:37:00

Тема: Программирование

Специальности: Системный архитектор

|

Вам нравится? Нравится 26 студентам

| Поделиться |

Поддержать курс

| Скачать электронную книгу

Управляющая программа анализатора

Управляющая программа одинакова для всех LR-анализаторов, а таблица изменяется от одного анализатора к другому. Программа анализатора читает последовательно символы входной цепочки. Программа использует магазин для запоминания строки следующего вида s₀X₁s₁X₂…X_ms_m, где s_m - вершина магазина. Каждый X_i - символ грамматики, а s_i - символ, называемый состоянием. Каждое состояние суммирует информацию, cодержащуюся в стеке перед ним. Комбинация символа состояния на вершине магазина и текущего входного символа используется для индексирования управляющей таблицы и определения операции переноса-свертки. При реализации грамматические символы не обязательно располагаются в магазине; однако, мы будем использовать их при обсуждении для лучшего понимания поведения LR-анализатора.

Программа, управляющая LR-анализатором, ведет себя следующим образом. Рассматривается пара: s_m - текущее состояние на вершине магазина, a_i - текущий входной символ; после этого вычисляется action [s _m, a _i ]:, которое может иметь одно из четырех значений:

shift s, где s - состояние,
свертка по правилу A->β ,
допуск (accept)
ошибка.

Функция goto получает состояние и символ грамматики и выдает состояние. Функция goto , строящаяся по грамматике G , есть функция переходов детерминированного магазинного автомата, который распознает язык, порождаемый грамматикой G.

Управляющая программа выглядит следующим образом:

Установить ip на первый символ входной цепочки w$;


while (цепочка не закончилась)
{
   Пусть s - состояние на вершине магазина, 
   a - символ входной цепочки, на который указывает ip.
   if (action [s, a] == shift s')
   {
      push (a);
      push (s');
      ip++;
   }
   else if (action [s, a] == reduce A->β)
   {
      for (i=1; i<=| β |;  i++)
      {
         pop ();
         pop ();
      }
      Пусть s' - состояние на вершине магазина;
      push (A);
      push (goto [s', A]);
      Вывод правила (A->β);
   }
   else if (action [s, a] == accept)
   {
      return success;
   }
   else
   {
      error ();       
   }
}

Управляющая таблица LR(0)-анализатора

Обсудим подробно алгоритм построения управляющей таблицы на примере LR(0)-анализаторов.

Заметим, что LR(0)-анализатор принимает решение о своих действиях только на основании содержимого магазина, не учитывая символы входной цепочки. Для иллюстрации построения таблиц LR(0)-анализатора мы будем использовать грамматику G₀:

(1)	S	->	(L)
(2)	S	->	x
(3)	L	->	S
(4)	L	->	L, S

Определение.Пусть G = (V_T, V_N, P, S) - КС-грамматика. Пополненной грамматикой (augmented grammar) будем называть грамматику G' = (V_T, V_N +{S'}, P+{S'->S}, S') , где S' - нетерминал, непринадлежащий множеству N.

Определение.Пусть G = (V_T, V_N, P, S) - КС-грамматика. Будем называть [A->w₁.w₂, u] LR(k)-ситуацией (LR(k)-item), если A-> w₁w₂ является правилом из P и u - цепочка терминалов, длина которой не превосходит k .

Понятно, что LR(0)-ситуации не должны содержать терминальной цепочки, то есть мы можем записывать их следующим образом: [A-> w₁.w₂] .

Далее мы рассмотрим поведение анализатора грамматики при разборе входной цепочки.

Дальше >>

Авторизоваться

Разработка компиляторов

Восходящие анализаторы

Управляющая программа анализатора

Управляющая таблица LR(0)-анализатора

Вопросы и ответы