Landau-Symbole

Aus cosmos-indirekt.de
Version vom 1. November 2017, 02:22 Uhr von imported>UKoch (oder Speicherplatzbedarf!)
(Unterschied) ← Nächstältere Version | Aktuelle Version (Unterschied) | Nächstjüngere Version → (Unterschied)

Landau-Symbole werden in der Mathematik und in der Informatik verwendet, um das asymptotische Verhalten von Funktionen und Folgen zu beschreiben. In der Informatik werden sie bei der Analyse von Algorithmen verwendet und geben ein Maß für die Anzahl der Elementarschritte oder der Speichereinheiten in Abhängigkeit von der Größe der Eingangsvariablen an. Die Komplexitätstheorie verwendet sie, um verschiedene Probleme danach zu vergleichen, wie „schwierig“ oder aufwendig sie zu lösen sind. Man sagt, „schwere Probleme“ wachsen exponentiell mit der Instanz oder schneller und für „leichte Probleme“ existiert ein Algorithmus, dessen Laufzeitzuwächse sich durch das Wachstum eines Polynoms beschränken lassen. Man nennt sie (nicht) polynomiell lösbar.

Notation Anschauliche Bedeutung
fo(g)

oder

f=o(g)

f wächst langsamer als g
f𝒪(g)

oder

f=O(g)

f wächst nicht wesentlich schneller als g
fΘ(g) f wächst genauso schnell wie g
f=Ω(g) f wächst nicht immer langsamer als g (Zahlentheorie)
fΩ(g) f wächst nicht wesentlich langsamer als g (Komplexitätstheorie)
fω(g) f wächst schneller als g

Geschichte des O-Symbols

Der Großbuchstabe O als Symbol für Ordnung von wurde erstmals vom deutschen Zahlentheoretiker Paul Bachmann in der 1894 erschienenen zweiten Auflage seines Buchs Analytische Zahlentheorie verwendet. Bekannt gemacht wurde diese Notation durch den ebenfalls deutschen Zahlentheoretiker Edmund Landau, mit dessen Namen sie insbesondere im deutschen Sprachraum heute in Verbindung gebracht wird.[1]

Sonderfall: Omega-Symbol

Zwei unvereinbare Definitionen

Es gibt in der Mathematik zwei sehr häufige und inkonsistente Definitionen für

f(x)=Ω(g(x)) (xa),

wobei a eine reelle Zahl, oder ist, wo die reellen Funktionen f und g auf einer Umgebung von a definiert sind und g in dieser Umgebung positiv ist.

Die erste wird in der analytischen Zahlentheorie benutzt und die andere in der Komplexitätstheorie. Diese Situation kann zu Verwechslungen führen.

Die Hardy-Littlewoodsche Definition

Im Jahr 1914 führten G. H. Hardy und J. E. Littlewood das Symbol Ω mit der Bedeutung

f(x)=Ω(g(x)) (x)lim supx|f(x)g(x)|>0

ein.[2] Also ist f(x)=Ω(g(x)) die Negation von f(x)=o(g(x)).

Im Jahr 1918 führten dieselben Verfasser zwei neue Symbole ΩR und ΩL mit den Bedeutungen

f(x)=ΩR(g(x)) (x)lim supxf(x)g(x)>0;
f(x)=ΩL(g(x)) (x)lim infxf(x)g(x)<0

ein.[3] Also ist f(x)=ΩR(g(x)) die Negation von f(x)<o(g(x)) und f(x)=ΩL(g(x)) die Negation von f(x)>o(g(x)).

Im Gegensatz zu einer späteren Aussage von D. E. Knuth[4] verwendete Edmund Landau diese drei Symbole im Jahre 1924 mit den gleichen Bedeutungen.[5]

Diese Hardy-Littlewood-Symbole sind Prototypen, sie werden nie genau so verwendet. ΩR ist zu Ω+ und ΩL zu Ω geworden.

Diese drei Symbole Ω,Ω+,Ω sowie f(x)=Ω±(g(x)) (dies bedeutet, dass die beiden Eigenschaften f(x)=Ω+(g(x)) und f(x)=Ω(g(x)) erfüllt sind) werden heute noch systematisch in der analytischen Zahlentheorie verwendet.

Einfache Beispiele

Wir haben

sinx=Ω(1) (x)

und speziell

sinx=Ω±(1) (x).

Wir haben

sinx+1=Ω(1) (x)

und speziell

sinx+1=Ω+(1) (x)

aber

sinx+1=Ω(1) (x).

Zahlentheoretische Notation

Die strenge Notation fΩ(g) wird in der Zahlentheorie nie benutzt und man schreibt weniger streng immer f=Ω(g). Dies bedeutet hier „f ist ein Omega von g“ und nichtf ist gleich ein Omega von g“.

Die Knuthsche Definition

Im Jahr 1976 veröffentlichte D. E. Knuth einen Artikel,[4] dessen Hauptziel es ist, eine andere Verwendung des Ω-Symbols zu rechtfertigen. Er bemüht sich, seine Leser zu überzeugen, dass die Hardy-Littlewoodsche Definition fast nie benutzt wird (auch im Jahr 1976 war es für mindestens 25 Jahre falsch[6]). Er schreibt, dass er bei Landau keine Anwendung finden konnte und dass George Pólya, der bei Landau studierte, seine, Knuths, Einschätzung bestätigte, dass Landau das Ω-Symbol wohl nicht verwendet hat. Knuth schreibt: “For all the applications I have seen so far in computer science, a stronger requirement […] is much more appropriate”. Es besteht kein Zweifel, dass er recht hat, wenn er das Symbol Ω verwendet, um diese stärkere Anforderung zu beschreiben: “Unfortunately, Hardy and Littlewood didn't define Ω(f(n)) as I wanted to”.

Unter der Gefahr von Missverständnissen und Verwirrung definiert er auch

f(x)=Ω(g(x))g(x)=O(f(x)).[7]

Definition

In der folgenden Tabelle bezeichnen f und g entweder

  • Folgen reeller Zahlen, dann ist x und der Grenzwert a=, oder
  • reellwertige Funktionen der reellen Zahlen, dann ist x und der Grenzwert aus den erweiterten reellen Zahlen: a{,+}, oder
  • reellwertige Funktionen beliebiger topologischer Räume (X,𝔗), dann ist xX und auch der Grenzwert aX. Wichtigster Spezialfall ist dabei X=n.

Formal lassen sich die Landau-Symbole dann mittels Limes superior und Limes inferior folgendermaßen definieren:

Notation Definition Mathematische Definition
fo(g) asymptotisch gegenüber g vernachlässigbar limxa|f(x)g(x)|=0
f𝒪(g) asymptotische obere Schranke lim supxa|f(x)g(x)|<
fΘ(g) asymptotisch scharfe Schranke, sowohl f𝒪(g) als auch g𝒪(f) 0<lim infxa|f(x)g(x)|lim supxa|f(x)g(x)|<
f=Ω(g) (Zahlentheorie) asymptotische untere Schranke, f ist nicht in o(g) lim supxa|f(x)g(x)|>0
fΩ(g) (Komplexitätstheorie) asymptotische untere Schranke, g𝒪(f) lim infxa|f(x)g(x)|>0
fω(g) asymptotisch dominant, go(f) limxa|f(x)g(x)|=

In der Praxis existieren meist die Grenzwerte limf(x)g(x), sodass die Abschätzung des limes superior oft durch die (einfachere) Berechnung eines Grenzwerts ersetzt werden kann.

Äquivalent zur Definition mit Limessymbolen können für einen metrischen Raum (X;d), insbesondere also für die Fälle X= und X=, folgende Definitionen mit Quantoren verwendet werden:

Notation xa<
fo(g)  C>0  ε>0  x{x:d(x,a)<ε}:|f(x)|C|g(x)|
f𝒪(g)  C>0  ε>0  x{x:d(x,a)<ε}:|f(x)|C|g(x)|
fΘ(g)  c>0  C>0  ε>0  x{x:d(x,a)<ε}:c|g(x)||f(x)|C|g(x)|
f=Ω(g) (Zahlentheorie)  c>0  ε>0  x{x:d(x,a)<ε}:c|g(x)||f(x)|
fΩ(g) (Komplexitätstheorie)  c>0  ε>0  x{x:d(x,a)<ε}:c|g(x)||f(x)|
fω(g)  c>0  ε>0  x{x:d(x,a)<ε}:c|g(x)||f(x)|
Notation x
fo(g)  C>0  x0>0  x>x0:|f(x)|C|g(x)|
f𝒪(g)  C>0  x0>0  x>x0:|f(x)|C|g(x)|
fΘ(g)  c>0  C>0  x0>0  x>x0:c|g(x)||f(x)|C|g(x)|
f=Ω(g) (Zahlentheorie)  c>0  x0>0  x>x0:cg(x)|f(x)| (die Test-Funktion g ist immer positiv)
fΩ(g) (Komplexitätstheorie)  c>0  x0>0  x>x0:c|g(x)||f(x)|
fω(g)  c>0  x0>0  x>x0:c|g(x)||f(x)|

Analoge Definitionen lassen sich auch für den Fall x sowie für einseitige Grenzwerte geben.

Folgerung

Für jede Funktion f werden durch

Ω(f),𝒪(f),Θ(f),o(f),ω(f)

jeweils Mengen von Funktionen beschrieben. Es gelten folgende Beziehungen zwischen diesen:

Θ(f)𝒪(f)Θ(f)Ω(f)Θ(f)=𝒪(f)Ω(f)ω(f)Ω(f)o(f)𝒪(f)=ω(f)o(f)

Beispiele und Notation

Bei der Verwendung der Landau-Symbole wird die darin verwendete Funktion häufig verkürzt angegeben. Statt zum Beispiel 𝒪(g) mit g:,xx3 schreibt man häufig verkürzend 𝒪(x3). Dies wird auch in den folgenden Beispielen so gehandhabt.

Notation Bedeutung Anschauliche Erklärung Beispiele für Laufzeiten
f𝒪(1) f ist beschränkt. f überschreitet einen konstanten Wert nicht (unabhängig vom Wert des Arguments). Nachschlagen des x-ten Elementes in einem Feld
f𝒪(logx) f wächst logarithmisch. f wächst ungefähr um einen konstanten Betrag, wenn sich das Argument verdoppelt.

Die Basis des Logarithmus ist dabei egal.

Binäre Suche im sortierten Feld mit x Einträgen
f𝒪(x) f wächst wie die Wurzelfunktion. f wächst ungefähr auf das Doppelte, wenn sich das Argument vervierfacht. Naiver Primzahltest mittels Teilen durch jede ganze Zahl x
f𝒪(x) f wächst linear. f wächst ungefähr auf das Doppelte, wenn sich das Argument verdoppelt. Suche im unsortierten Feld mit x Einträgen (Bsp. Lineare Suche)
f𝒪(xlogx) f hat super-lineares Wachstum Fortgeschrittenere Algorithmen zum Sortieren von x Zahlen

Mergesort, Heapsort

f𝒪(x2) f wächst quadratisch. f wächst ungefähr auf das Vierfache, wenn sich das Argument verdoppelt. Einfache Algorithmen zum Sortieren von x Zahlen

Selectionsort

f𝒪(xn) f wächst polynomiell. f wächst ungefähr auf das 2n-Fache, wenn sich das Argument verdoppelt. „Einfache“ Algorithmen
f𝒪(2x) f wächst exponentiell. f wächst ungefähr auf das Doppelte, wenn sich das Argument um 1 erhöht. Erfüllbarkeitsproblem der Aussagenlogik (SAT) mittels exhaustiver Suche
f𝒪(x!) f wächst faktoriell. f wächst ungefähr auf das (x+1)-Fache, wenn sich das Argument um 1 erhöht. Problem des Handlungsreisenden (mit Enumerationsansatz)

Die Landau-Notation wird verwendet, um das asymptotische Verhalten bei Annäherung an einen endlichen oder unendlichen Grenzwert zu beschreiben. Das große 𝒪 wird verwendet, um eine maximale Größenordnung anzugeben. So gilt beispielsweise nach der Stirling-Formel für das asymptotische Verhalten der Fakultät

n!=2πn(ne)n(1+𝒪(1n)) für n

und

n!=𝒪(n(ne)n) für n.

Der Faktor 2π ist dabei nur eine Konstante und kann für die Abschätzung der Größenordnung vernachlässigt werden.

Die Landau-Notation kann auch benutzt werden, um den Fehlerterm einer Approximation zu beschreiben. Beispielsweise besagt

ex=1+x+x2/2+𝒪(x3) für x0,

dass der Absolutbetrag des Approximationsfehlers kleiner als eine Konstante mal x3 für x hinreichend nahe bei Null ist.

Das kleine o wird verwendet, um zu sagen, dass ein Ausdruck vernachlässigbar klein gegenüber dem angegebenen Ausdruck ist. Für differenzierbare Funktionen gilt beispielsweise

f(x+h)=f(x)+hf(x)+o(h) für h0,

der Fehler bei Approximation durch die Tangente geht also schneller als linear gegen 0.

Notationsfallen

Symbolisches Gleichheitszeichen

Oft wird in der Mathematik bei der Landau-Notation das Gleichheitszeichen verwendet. Es handelt sich dabei aber um eine rein symbolische Schreibweise und nicht um eine Gleichheitsaussage, auf die beispielsweise die Gesetze der Transitivität oder der Symmetrie anwendbar wären: Eine Aussage wie f(x)=𝒪(g(x)) ist keine Gleichung und keine Seite ist durch die andere bestimmt. Aus f1(x)=𝒪(g(x)) und f2(x)=𝒪(g(x)) folgt nicht, dass f1 und f2 gleich sind. Genauso wenig kann man aus f(x)=𝒪(g1(x)) und f(x)=𝒪(g2(x)) schließen, dass 𝒪(g1(x)) und 𝒪(g2(x)) dieselbe Klasse sind oder die eine in der anderen enthalten ist.

Tatsächlich handelt es sich bei 𝒪(g(x)) um eine Menge, welche alle diejenigen Funktionen enthält, welche höchstens so schnell wachsen wie g(x). Die Schreibweise f(x)𝒪(g(x)) ist also formal korrekt.

Die Notation mit dem Gleichheitszeichen wie in f=𝒪(g) wird trotzdem in der Praxis ausgiebig genutzt. Beispielsweise soll der Ausdruck f(n)=h(n)+Θ(g(n)) besagen, dass es Konstanten c1 und c2 gibt, sodass

h(n)+c1g(n)f(n)h(n)+c2g(n)

für hinreichend große n gilt.

Vergessener Grenzwert

Eine weitere Falle besteht darin, dass oft nicht angegeben wird, auf welchen Grenzwert sich das Landausymbol bezieht. Der Grenzwert ist aber wesentlich; so ist beispielsweise 1xo(1x) für x, nicht aber für den einseitigen Grenzwert x0. Normalerweise wird der betrachtete Grenzwert aber aus dem Zusammenhang klar, sodass hier Mehrdeutigkeiten nur selten auftreten.

Anwendung in der Komplexitätstheorie

Die Artikel Landau-Symbole#Anwendung in der Komplexitätstheorie, Komplexität (Informatik) und Komplexitätstheorie überschneiden sich thematisch. Hilf mit, die Artikel besser voneinander abzugrenzen oder zusammenzuführen (→ Anleitung). Beteilige dich dazu an der betreffenden Redundanzdiskussion. Bitte entferne diesen Baustein erst nach vollständiger Abarbeitung der Redundanz und vergiss nicht, den betreffenden Eintrag auf der Redundanzdiskussionsseite mit {{Erledigt|1=~~~~}} zu markieren. Accountalive 03:47, 1. Jan. 2010 (CET)

In der Komplexitätstheorie werden die Landau-Symbole vor allem verwendet, um den (minimalen, mittleren oder maximalen) Zeit- oder Speicherplatzbedarf eines Algorithmus zu beschreiben. Man spricht dann von Zeitkomplexität bzw. Platzkomplexität. Die Komplexität kann vom verwendeten Maschinenmodell abhängen. In der Regel nimmt man jedoch ein „normales“ Modell an, zum Beispiel ein der Turingmaschine äquivalentes.

Oft ist es sehr aufwendig oder ganz unmöglich, für ein Problem L eine Funktion fL:wfL(w) anzugeben, die allgemein jeder beliebigen Eingabe für ein Problem die zugehörige Anzahl der Rechenschritte (bzw. der Speicherzellen) zuordnet. Daher begnügt man sich in der Regel damit, statt jede Eingabe einzeln zu erfassen, sich lediglich auf die Eingabelänge n=|w| zu beschränken. Es ist aber meist ebenfalls zu aufwendig, eine Funktion fL:nfL(n),n=|w| anzugeben.

Daher hat man die Landau-Notation entwickelt, die sich auf das asymptotische Verhalten der Funktion fL beschränkt. Man betrachtet also, in welchen Schranken sich der Rechenaufwand (der Bedarf an Speicher und Rechenzeit) hält, wenn man die Eingabe vergrößert. Das wichtigste Landau-Symbol ist 𝒪 (großer lateinischer Buchstabe „O“), mit dem man obere Schranken angeben kann; untere Schranken sind im Allgemeinen viel schwieriger zu finden. Dabei bedeutet f𝒪(g) (oft auch f(n)=𝒪(g(n))), dass eine Konstante c>0 und ein n0 existieren, so dass für alle n>n0 gilt: f(n)cg(n). In anderen Worten: Für alle Eingabelängen ist der Rechenaufwand f(n) nicht wesentlich größer – d. h. höchstens um einen konstanten Faktor c – als g(n).

Dabei ist die Funktion f nicht immer bekannt; als Funktion g wird hingegen meist eine Funktion gewählt, deren Wachstum gut bekannt ist (wie g(x)=x2 oder g(x)=2x). Die Landau-Notation ist gerade dazu da, den Rechenaufwand (Platzbedarf) abzuschätzen, wenn es zu aufwendig ist, die genaue Funktion anzugeben, bzw. wenn diese zu kompliziert ist.

Die Landau-Symbole erlauben es dadurch, Probleme und Algorithmen nach ihrer Komplexität in Komplexitätsklassen zusammenzufassen.

In der Komplexitätstheorie lassen sich die verschiedenen Probleme und Algorithmen dann folgendermaßen vergleichen: Man kann für Problemstellungen mit Ω eine untere Schranke für beispielsweise die asymptotische Laufzeit angeben, mit 𝒪 entsprechend eine obere Schranke. Bei 𝒪(f) wird die Form von f (z. B. f(n)=n2) auch als die Komplexitätsklasse oder Aufwandsmaß bezeichnet (also z. B. quadratisch).

Bei dieser Notation werden, wie die Definitionen der Landau-Symbole zeigen, konstante Faktoren vernachlässigt. Dies ist gerechtfertigt, da die Konstanten zu großen Teilen vom verwendeten Maschinenmodell bzw. bei implementierten Algorithmen von der Qualität des Compilers und diversen Eigenschaften der Hardware des ausführenden Computer abhängig sind. Damit ist ihre Aussagekraft über die Komplexität des Algorithmus sehr beschränkt.

Siehe auch

Quellen

  1. Earliest Uses of Symbols of Number Theory, 22. September 2006: (Memento vom 19. Oktober 2007 im Internet Archive) According to Wladyslaw Narkiewicz in The Development of Prime Number Theory: “The symbols O(·) and o(·) are usually called the Landau symbols. This name is only partially correct, since it seems that the first of them appeared first in the second volume of P. Bachmann’s treatise on number theory (Bachmann, 1894). In any case Landau (1909a, p. 883) states that he had seen it for the first time in Bachmann's book. The symbol o(·) appears first in Landau (1909a).”
  2. Godfrey H. Hardy, John E. Littlewood: Some problems of Diophantine approximation. Part II. The trigonometrical series associated with the elliptic ϑ-functions. In: Acta Mathematica. Bd. 37, 1914, S. 193–239, hier S. 225, doi:10.1007/BF02401834.
  3. Godfrey H. Hardy, John E. Littlewood: Contribution to the theory of the Riemann zeta-function and the theory of the distribution of primes. In: Acta Mathematica. Bd. 41, 1916, S. 119–196, doi:10.1007/BF02422942.
  4. 4,0 4,1 Donald Knuth: Big Omicron and big Omega and big Theta. SIGACT News, Apr.–June 1976, 18–24 (PDF; 348 kB).
  5. Edmund Landau: Über die Anzahl der Gitterpunkte in gewissen Bereichen. (Vierte Abhandlung). In: Nachrichten von der Gesellschaft der Wissenschaften zu Göttingen. Mathematisch-Physikalische Klasse. 1924, S. 137–150 (Digitalisat (PDF; 437,39 kB)).
  6. Edward C. Titchmarsh: The Theory of the Riemann Zeta-Function. Clarendon Press, Oxford 1951.
  7. Mit dem Kommentar: “Although I have changed Hardy and Littlewood's definition of Ω, I feel justified in doing so because their definition is by no mean in wide use, and because there are other ways to say what they want to say in the comparatively rare cases when their definition applies”.