Языки и исчисления

Теорема Тарского-Зайденберга


В этом разделе мы покажем, что в элементарной теории действительных чисел со сложением и умножением выполнима элиминация кванторов. Более точно, рассмотрим сигнатуру, содержащую предикаты и , константы и , а также операции сложения и умножения. Рассмотрим интерпретацию этой сигнатуры, носителем которой является множество действительных чисел, а предикаты и операции понимаются естественным образом. Тогда для каждой формулы существует эквивалентная (выражающая тот же предикат) бескванторная формула. Это утверждение называют теоремой Тарского-Зайденберга.

Прежде чем доказывать эту теорему, сделаем несколько комментариев:

  • Свойство можно выразить как "существует ненулевое , для которого ". Таким образом, класс выразимых предикатов не изменится, если мы удалим символ из сигнатуры. (Но предикатов, выразимых бескванторными формулами, станет меньше: свойство , как легко понять, не эквивалентно никакой бескванторной формуле, содержащей константы, сложение, умножение и равенство.)
  • Бескванторную формулу нашей сигнатуры можно привести к дизъюнктивной нормальной форме, после чего она превратится в совокупность систем уравнений вида и неравенств вида . В самом деле, в конъюнкциях могут еще быть отрицания, то есть отношения и , но можно разбить на , а на , после чего воспользоваться дистрибутивностью.
  • Подмножества , задаваемые уравнениями вида и неравенствами вида (где — произвольный многочлен от нескольких переменных с целыми коэффициентами), а также множества, получаемые из них любым числом операций объединения и пересечения, называют полуалгебраическими. Предыдущее замечание показывает, что всякая бескванторная формула задает полуалгебраическое множество. (Полуалгебраические множества являются обобщениями алгебраических множеств, задаваемых системами полиномиальных уравнений.)
  • Из теоремы Тарского-Зайденберга вытекает, что проекция полуалгебраического множества вдоль одной из осей является полуалгебраическим подмножеством пространства . В самом деле, переход к проекции приводит к добавлению квантора существования, который можно затем элиминировать. (Утверждение о полуалгебраичности проекции полуалгебраического множества по существу равносильно теореме Тарского-Зайденберга, так как элиминация квантора существования является единственным нетривиальным шагом в доказательстве этой теоремы.)
  • Пример: равенство задает полуалгебраическое (и даже алгебраическое) множество троек .
    Какова будет его проекция вдоль оси на плоскость ? Как учат в школе, это будет множество , которое оказывается полуалгебраическим в полном согласии с теоремой Тарского-Зайденберга. Про аналогичные критерии разрешимости уравнений большей степени в школе не учат, но теорема Тарского-Зайденберга гарантирует их существование.
  • Как и во всех предыдущих случаях элиминации кванторов, преобразование формулы в бескванторную формулу эффективно (выполняется некоторым алгоритмом). В частности, этот алгоритм можно применить к замкнутой формуле (формуле без параметров). Тогда получится бескванторная формула без параметров (формально говоря, там могут быть параметры, от значений которых ничего не зависит, но их можно заменить, скажем, нулями). Истинность такой формулы можно алгоритмически проверить. Тем самым можно алгоритмически проверить истинность любого утверждения о действительных числах, выраженного формулой нашей сигнатуры. Как говорят, элементарная теория действительных чисел со сложением и умножением разрешима.
  • Большинство утверждений школьного курса геометрии с помощью метода координат можно записать как утверждения о действительных числах в нашей сигнатуре. (Исключение, впрочем, составляют утверждения, где речь идет не о треугольниках и четырехугольниках, а о - угольниках без указания конкретного ). Записав теоремы в виде замкнутых формул нашей сигнатуры, можно алгоритмически проверить их истинность. Тем самым мы получаем общий метод доказательства большинства теорем школьной геометрии (впрочем, он имеет лишь теоретическое значение, так как алгоритм работает необозримо долго на сколько-нибудь сложных формулах).


Теорема 33 (Тарского-Зайденберга). Для всякой формулы сигнатуры существует бескванторная формула, задающая тот же предикат на множестве действительных чисел.

Как обычно, достаточно рассматривать формулу с единственным квантором существования, то есть формулу вида где — бескванторная формула, включающая в себя только переменные из числа . Надо доказать, что найдется эквивалентная формуле



бескванторная формула .

Посмотрим на атомарные формулы, входящие в формулу . Перенося все переменные в одну часть, можно считать, что каждая атомарная формула имеет вид или , где — некоторый многочлен с целыми коэффициентами от переменных . Кольцо многочленов с целыми коэффициентами от переменных обозначается через . Группировка членов по степеням переменной дает многочлен от , коэффициенты которого представляют собой многочлены от . Символически это записывается так: (многочлены от переменных можно рассматривать как многочлены от одной переменной, коэффициенты которых лежат в кольце многочленов от переменных).

При фиксации значений переменных входящие в многочлены превращаются в многочлены от одной переменной с числовыми коэффициентами. Формула выражает тогда какое-то свойство этих многочленов и может быть истинной или ложной. Нам надо доказать, что те , при которых она истинна, образуют полуалгебраическое множество.

Для этого введем понятие диаграммы семейства многочленов. Пусть — многочлены от

с действительными коэффициентами. Диаграммой набора будет таблица, которая строится так. Возьмем все корни всех многочленов (не считая нулевых многочленов) и расположим их в порядке возрастания. Получим некоторый набор чисел . Эти числа разбивают числовую ось на промежутков (два луча и

интервалов), на каждом из которых знаки всех постоянны. Составим таблицу, в которой будет строк (по одной для каждого из многочленов) и столбцов, соответствующих

корням и промежуткам (столбцы идут в порядке возрастания, так что корни чередуются с промежутками). В каждой ячейке таблицы запишем один из трех символов , или в зависимости от того, является ли многочлен положительным, отрицательным или нулевым на соответствующем промежутке (или в соответствующем корне).

Пример. Выпишем диаграмму для системы многочленов , , . Корнями здесь будут числа , , , так что столбцы соответствуют четырем промежуткам и трем разделяющим их корням.

Отметим, что значения корней не являются частью диаграммы, так что, например, система многочленов , , имеет точно такую же диаграмму.




Если ни один из многочленов не имеет корней, то они сохраняют знак на всей прямой, и диаграмма состоит из единственного столбца, в котором записаны все эти знаки.

Теперь рассмотрим набор многочленов . При фиксированных значениях переменных мы получаем набор многочленов от одной переменной с действительными коэффициентами и можем построить его диаграмму. Эта диаграмма будет зависеть от выбора значений . Число строк в диаграмме равно , а ширина ее зависит от числа различных корней и может меняться, однако во всех случаях не превосходит , где — сумма степеней всех многочленов (рассматриваются степени по , то есть степени соответствующих многочленов от с коэффициентами в ).

Таким образом, число возможных диаграмм конечно, и пространство возможных значений переменных

разбивается на конечное число частей: каждая часть соответствует одному из возможных значений диаграммы.

Для доказательства теоремы Тарского-Зайденберга достаточно доказать, что эти части будут полуалгебраическими множествами. В самом деле, если в качестве многочленов

взять многочлены, входящие в формулу , то область истинности формулы будет объединением нескольких частей соответствующего разбиения. В самом деле, если мы двигаем точку

в пределах одной части разбиения, то диаграмма не меняется, значит, и истинность формулы не меняется (по диаграмме можно определить истинность формулы, перепробовав значения , соответствующие всем столбцам).

Итак, нам осталось доказать, что для любого набора многочленов части пространства , соответствующие различным значениям диаграммы, являются полуалгебраическими множествами. Начнем с такого очевидного наблюдения: если это верно для какого-то набора , то это останется верным и для любого меньшего набора. В самом деле, диаграмму меньшего семейства многочленов можно получить из диаграммы большего семейства: выкидывая многочлен, надо выбросить соответствующую строку, а также столбцы, которые соответствовали корням этого многочлена (если они не были корнями других многочленов).


При выбрасывании столбца два окружающих его столбца сливаются в один.

Поэтому мы имеем право для удобства расширить данный нам набор многочленов и доказывать полуалгебраичность частей для расширенного набора. Расширение будет состоять в замыкании относительно некоторых операций, которые мы сейчас опишем.

Напомним еще раз, что мы рассматриваем семейство многочленов из , которые разложены по степеням , то есть записаны как многочлены от с коэффициентами в . Рассмотрим следующие операции:

  • отбрасывание старшего члена (с наибольшей степенью переменной ); эта операция понижает степень (по ) на единицу;
  • взятие старшего коэффициента (коэффициента при наибольшей степени переменной ); эта операция понижает степень (по ) до нуля;
  • дифференцирование по ; эта операция понижает степень (по ) на единицу;
  • взятие модифицированного остатка при делении одного многочлена на другой.


Говоря о "модифицированном остатке", мы имеем в виду следующее. При делении "уголком" многочлена на многочлен с остатком нам неоднократно приходится делить на старший коэффициент многочлена . Поэтому в общем случае коэффициенты частного и остатка представляют собой дроби, в знаменателях которых стоят некоторые степени старшего коэффициента многочлена .

Тем самым при вычислении остатка от деления

на мы выходим за пределы кольца . Этого не случится, если старший коэффициент многочлена равен единице. Но в общем случае мы должны принять какие-то меры, если хотим оставаться в указанном кольце. Меры эти состоят в следующем: прежде чем делить на , мы умножаем на старший коэффициент многочлена в достаточно большой степени. Если вспомнить процедуру деления уголком, легко сообразить, что достаточно взять степень , где и — степени многочленов и (по переменной ). Например, при требуется всего один шаг деления, и достаточно умножить на старший коэффициент многочлена в первой степени.

Итак, операция модифицированного остатка применима к любым двум многочленам степеней и (по ) и дает третий многочлен этого кольца, который есть остаток от деления на



(здесь — старший коэффициент многочлена ). Заметим, что степень этого многочлена меньше степени многочлена . Мы будем предполагать, что (иначе остаток совпадает с и деление не дает ничего нового). Таким образом, результат этой операции имеет меньшую степень, чем оба операнда.

Заметим, что определение модифицированного остатка имеет смысл для многочленов с коэффициентами из произвольного кольца (не только ).

Лемма 1. Для всякого конечного множества

многочленов из существует его конечное расширение, замкнутое относительно указанных четырех операций.

Это утверждение верно для любого кольца коэффициентов и почти очевидно следует из того, что степень результата операции меньше степени (любого) операнда. Более формально рассуждать надо так. Рассмотрим выражения, составленные из элементов с помощью четырех указанных операций. Глубина такого выражения не превосходит максимальной степени многочленов из , поскольку каждая операция уменьшает степень. Поэтому таких выражений конечное число, и их множество очевидным образом замкнуто относительно указанных операций. Лемма 1 доказана.

Доказанная лемма позволяет без ограничения общности считать, что данное нам конечное множество многочленов замкнуто относительно четырех указанных выше операций.

Лемма 2. Пусть — конечное множество многочленов из , замкнутое относительно перечисленных операций. Пусть — его часть, состоящая только из многочленов степени по (они представляют собой многочлены из ). Тогда диаграмма множества

при данных полностью определяется диаграммой множества при тех же .

Заметим, что диаграмма множества имеет всего один столбец, указывающий, какие из многочленов положительны, какие отрицательны и какие равны нулю при данных . Поэтому различным вариантам диаграммы для множества

соответствуют полуалгебраические подмножества в , и из леммы 2 следует, что те же самые множества составят искомое разбиение для полной системы . Таким образом, нам осталось лишь доказать лемму 2.

Будем добавлять в множество многочлены по одному, в порядке возрастания (неубывания) их степеней, пока не получим все множество .


Достаточно показать, что на каждом шаге диаграмма расширенного множества (с новым многочленом) может быть однозначно восстановлена по диаграмме предыдущего множества. Мы сейчас опишем, как это делается.

Пусть добавляется многочлен , при этом многочлены всех меньших степеней из уже есть в диаграмме. В силу замкнутости старший коэффициент многочлена содержится в и, имея меньшую (нулевую) степень, уже представлен в диаграмме. (Соответствующая строка состоит из одинаковых знаков, так как он не зависит от .) Если там стоят нули, то (при данных ) старший коэффициент равен нулю, и многочлен совпадает с многочленом, получающимся при отбрасывании старшего члена. Этот многочлен тоже есть в и в диаграмме, так что надо лишь продублировать соответствующую строку.

Итак, достаточно рассмотреть случай, когда старший коэффициент многочлена (при данных ) не равен нулю. Пополнение диаграммы включает в себя два шага: сначала мы должны определить знаки многочлена в точках (корнях), уже входящих в диаграмму. Затем надо пополнить диаграмму корнями многочлена

(при этом число столбцов в ней увеличится).

Как найти знак многочлена в одной из старых точек? По определению диаграммы в этой точке (обозначим ее ) один из старых многочленов равен нулю. Пусть — такой многочлен. Можно считать, что старший коэффициент (как многочлена от ) отличен от нуля при данных . Если это не так, заменим на многочлен, получающийся отбрасыванием старшего члена. Мы знаем, что множество замкнуто относительно четырех операций и что все многочлены из , имеющие меньшую степень, уже входят в диаграмму. Поэтому вся необходимая информация для отбора подходящего у нас есть.

Кроме того, по тем же причинам нам известен знак старшего коэффициента многочлена . Применим операцию модифицированного деления с остатком к и : (здесь — старший коэффициент многочлена ). Подставим в это равенство число . При этом обратится в нуль, так как является корнем по построению. Многочлен входит в диаграмму в силу наших предположений, так что его знак в точке нам известен, как и знак .


Тем самым можно найти знак .

Итак, мы определили знак нового многочлена в старых корнях. Покажем, что этого достаточно, чтобы предсказать, на каких участках диаграммы появятся новые корни (многочлена ). При этом нам пригодится (пока что не использованная) операция дифференцирования.

Если в двух соседних старых корнях ,

многочлен имеет один и тот же знак (скажем, положителен), то между ними нет нового корня. В самом деле, если бы на интервале многочлен

обращался в нуль, то минимум многочлена на

достигался бы в некоторой внутренней точке, в которой производная равнялась бы нулю. Но производная

входит в множество и представлена в диаграмме, так что тогда и не были бы соседними корнями диаграммы.

Если в одной из точек и

многочлен

обращается в нуль, то на интервале он корней иметь не может (по теореме Ролля такой корень повлек бы за собой корень производной).

Наконец, если и имеют разные знаки, то по теореме о промежуточном значении многочлен имеет на интервале хотя бы один корень. При этом по уже понятным нам причинам (теорема Ролля) двух корней он иметь не может. Это позволяет вставить столбец для этого корня в диаграмму. При этом соответствующий интервал диаграммы разобьется на два, которые будут отличаться лишь в строке для многочлена .

Осталось провести аналогичное рассуждение для лучей, стоящих с края диаграммы. Поведение многочлена на бесконечности определяется его старшим коэффициентом (который, напомним, не равен нулю — сейчас мы впервые используем это предположение). Поэтому если стремится, скажем, к при , а значение в самом правом корне было отрицательным, то на этом луче появляется новый корень (только один по теореме Ролля). Если же значение в самом правом корне равно нулю или имеет тот же знак, что и старший коэффициент, то мы повторяем рассуждение из предыдущего абзаца и убеждаемся, что корней на правом луче нет. Аналогично определяется и поведение слева от самого левого корня.

На этом доказательство леммы 2, а с ней и теоремы Тарского-Зайденбрега, завершается.



67. Докажите, что множество троек , при которых многочлен имеет ровно два положительных корня, является полуалгебраическим.

Подобного рода задачи рассматривались в алгебре еще в прошлом веке (число перемен знака, правило Штурма и др.).

68. Докажите, что предикат , где — некоторое действительное число, выразим тогда и только тогда, когда является алгебраическим.

Разобравшись с действительными числами, можно перейти к комплексным. На самом деле (как часто бывает) здесь ситуация проще.

На комплексных числах нет естественного отношения порядка, поэтому рассмотрим сигнатуру . Будем, как всегда, считать две формулы эквивалентными, если они истинны при одних и тех же значениях параметров (в естественной интерпретации с носителем ).

Теорема 34 (элиминация кванторов в поле комплексных чисел).

Всякая формула этой сигнатуры эквивалентна бескванторной.

Эта теорема имеет много разных доказательств, но после доказательства теоремы Тарского-Зайденберга нам проще всего модифицировать его.

Теперь в диаграммах будут стоять не знаки , а только знаки и (поскольку порядка на нет). По той же причине мы не можем упорядочить корни, так что диаграмма будет состоять из неупорядоченных столбцов, соответствующих корням, и одного столбца, соответствующего дополнению к множеству корней (в котором будут стоять знаки для всех многочленов, кроме нулевых). Говоря о неупорядоченных столбцах, мы имеем в виду, что не различаем диаграммы, отличающиеся лишь порядком столбцов.

Основной шаг в доказательстве теоремы Тарского-Зайденберга (единственный, где важен порядок на действительных числах) состоял в пополнении диаграммы новым многочленом. Что будет с ним теперь?

Как и раньше, мы можем определить, в каких старых корнях новый многочлен равен нулю. Более того, мы можем определить кратность этих нулей, так как знаем все необходимое про его производные (которые уже включены в диаграмму). Поэтому основная теорема алгебры говорит нам, сколько будет новых корней (заметим, что все новые корни имеют кратность , так как иначе они были бы корнями производной и не были бы новыми).


Поскольку порядка на корнях нет, больше никакой информации нам и не нужно.

69. Провести доказательство элиминации кванторов в поле , не использующее диаграмм (это можно сделать, начав с приведения бескванторной формулы к дизъюнктивной нормальной форме, а затем применяя разные соображения из алгебры о наибольшем общем делителе многочленов). Для теоремы Тарского-Зайденберга это несколько сложнее; рассуждение такого рода приведено в книжке Энгелера [32]

70. Докажите, что множество тех четверок комплексных чисел , при которых многочлены и

имеют общий корень, задается бескванторной формулой. Найти эту формулу.

Задача 70 хорошо знакома алгебраистам. Ответ в ней можно записать в виде , где — многочлен, называемый результантом и равный определителю матрицы

71. Докажите, что множество всех пар комплексных чисел , при которых многочлен имеет хотя бы один кратный корень, задается бескванторной формулой. Найти эту формулу. Как выглядит аналогичная формула для многочлена ?

(Ответ к задаче тоже хорошо известен в алгебре; соответствующий многочлен называется дискриминантом.)

72. Обобщить утверждение предыдущей задачи на многочлены произвольной степени со старшим коэффициентом и найти выражение дискриминанта в виде определителя.


Содержание раздела