http://www.jstor.org/stable/2369948 .
Questa elaborazione della Teoria dei Tipi finalizzata all’eliminazione di alcune contraddizioni della logica matematica è importante anche perché è stata la base dell’elaborazione della logica matematica di Frank Ramsey in particolare in The Foundation of Mathematics nonché dell’elaborazione logica di Ludwig Wittgenstein nel “Tractatus” per alcune parti come il concetto di uguaglianza.
Pertanto questo testo è importante per capire alcune parti dell’elaborazione logico-filosofica di due dei primi rappresentanti dell’ingegneria della conoscenza.
Questa è la traduzione.
La Logica matematica sulla base della teoria dei tipi.
DI BERTRAND RUSSELL.
La seguente teoria della logica simbolica mi viene consigliata in primo luogo per la sua capacità di risolvere alcune contraddizioni, di cui quella più nota ai matematici è la Burali-Forti riguardante il più grande ordinale.* Ma la teoria in questione non sembra totalmente dipendente da questa indicazione indiretta; ha anche, se non mi sbaglio, una certa consonanza con il senso comune che la rende intrinsecamente credibile. Questo, tuttavia, non è un merito a cui sarebbe da attribuire molta enfasi; perché il senso comune è molto più fallibile di quello che ci piace pensare. Pertanto comincerò esponendo alcune delle contraddizioni da risolvere, e poi mostrerò come la teoria dei tipi logici determini la loro soluzione.
* Vedi sotto.
I
Le contraddizioni.
(1) La più antica contraddizione del genere in questione è quella di Epimenide.
Epimenide il cretese dice che tutti i cretesi erano bugiardi, e tutte le altre affermazioni fatte da Cretesi erano certamente bugie. Era questa una bugia? La forma più semplice di questa contraddizione è offerta da un uomo che dice “Io sto mentendo”; se sta mentendo, sta dicendo la verità, e viceversa.
(2) Sia w la classe di tutte le classi che non sono membri di se stesse. Quindi, qualsiasi classe x sia, “x è un w” è equivalente † a “x non è un x.” Quindi, dando alla x il valore w, “w è un w” è equivalente a “w non è un w.”
† Due proposizioni sono dette equivalenti quando sono entrambe vere o entrambe sono false.
(3) Sia T il rapporto che sussiste tra due relazioni R e S ogniqualvolta che R non ha la relazione R con S. Quindi, quale che possano essere le relazioni R e S, “R ha la relazione T con S” è equivalente a “R non ha la relazione R con S. “Quindi, dando il valore T sia a R sia a S, “T ha la relazione T con T” è equivalente a “T non ha la relazione T con T.”
(4) Il numero di sillabe nei nomi in inglese di un numero intero finito tende ad aumentare con il crescere dei numeri interi più rapidamente, e devono gradualmente aumentare indefinitamente, dal momento che solo un numero finito di nomi può essere fatta con un determinato numero finito di sillabe. Perciò i nomi di alcuni numeri interi deve essere composto da almeno diciannove sillabe, e tra queste ci deve essere un minimo. Quindi “il minimo intero non nominabile in meno di diciannove sillabe” deve indicare un numero intero definito; infatti, denota 111.777. Ma “il minimo intero non nominabile in meno di diciannove sillabe” è di per sé un nome composto da diciotto sillabe; quindi il minimo intero non nominabile in meno di diciannove sillabe può essere nominato in diciotto sillabe, che è una contraddizione. *
* Questa contraddizione mi è stata suggerita dal signor G.G. Berry della Bodleian Library.
(5) Tra gli ordinali transfiniti alcuni possono essere definiti, mentre altri non possono esserlo; perché il numero totale di possibili definizioni è ℵ0, mentre il numero degli ordinali transfiniti supera ℵ0. Quindi ci devono essere ordinali indefinibili, e tra questi ci deve essere un minimo. Ma questo è definito come “il minimo ordinale indefinibile”, che è una contraddizione. †
† Cf. König, “Ueber die Grundlagen der Mengenlehre und das Kontinuumproblem,” Math. Annalen, vol. LXI (1905); A.C. Dixon, “On ‘Well ordered, “aggregates, “Proc. London Math. Soc., Serie 2, vol. IV, parte I (1906); e E.W. Hobson, “On the Arithmetic Continuum”, ibid. La soluzione offerta nell’ultimo di questi articoli non mi sembra adeguata.
6) Il paradosso di Richard ‡ è simile a quella del minimo ordinale indefinibile. Esso è il seguente: Si considerino tutti i decimali che possono essere definiti mediante un numero finito di parole; sia E la classe di tali decimali. Allora E ha ℵ0 termini; quindi i suoi membri possono essere ordinati come il 1 °, 2 °, 3 °, .. .. Sia N un numero definito come segue: Se la cifra ennesima nell’ennesimo decimale è p, sia l’ennesima cifra in N p + 1 (o 0, se p = 9). Allora N è diverso da tutti i membri della classe E, poiché, qualunque valore finito n possa avere, l’ennesima cifra in N è diversa dalla cifra ennesima nell’ennesimo dei decimali che compone la classe E, e quindi N è diverso nell’ennesimo decimale. Tuttavia abbiamo definito N in un numero finito di parole, e quindi N dovrebbe essere un membro di E. Quindi N è sia membro e sia non membro di E.
‡ Cf. Poincaré, “Les mathématiques et la logique,” Revue de Metaphysique et de Morale, Mai, 1906, in particolare le sezioni VII e IX; anche Peano, Revista de Mathematica, vol. VIII, No. 5 (1906), p. 149 ss.
(7) La contraddizione § di Burali-Forti può essere definita come segue: si può dimostrare che ogni serie ben ordinata ha un numero ordinale, che la serie di ordinali fino a e includendo ogni ordinale supera l’ordinale dato per una unità, e (per alcune ipotesi molto naturali) che le serie di tutti gli ordinali (in ordine di grandezza) è ben ordinata. Ne consegue che la serie di tutti gli ordinali ha un numero ordinale, che chiameremo Ω. Ma in questo caso la serie di tutti gli ordinali compreso Ω ha il numero ordinale Ω + 1, che deve essere maggiore di Ω. Quindi Ω non è il numero ordinale di tutti gli ordinali.
§ “Una questione sui Numeri transfiniti”, Rendiconti del Circolo Matematico di Palermo, vol. XI (1897).
In tutte le contraddizioni di cui sopra (che sono solo le selezioni da un numero infinito), vi è una caratteristica comune, che potremmo descrivere come auto-riferimento o riflessività. L’osservazione di Epimenide deve includere se stessa nel suo ambito di applicazione. Se tutte le classi, a condizione che non siano membri di se stesse, sono membri di w, questo deve valere anche per w; e allo stesso modo per l’analoga contraddizione relazionale. Nei casi di nomi e definizioni, i paradossi derivano dal considerare non nominabilità e indefinibilità come elementi nei nomi e nelle definizioni. Nel caso del paradosso di Burali-Forti, la serie il cui numero ordinale provoca la difficoltà è la serie di tutti i numeri ordinali. In ogni contraddizione qualcosa viene detto su tutti i casi di qualche genere, e da quello che viene detto sembra che venga generato un nuovo caso, che sia o meno della stessa natura dei casi in cui “tutto” era implicato in quanto è stato detto. Esaminiamo le contraddizioni una per una e vediamo come queste avvengano.
(1) Quando una persona dice: “Io sto mentendo”, possiamo interpretare la sua dichiarazione come: “Esiste una proposizione che io sto affermando e che è falsa” Tutte le affermazioni che “esiste” così-e-così possono essere considerate come il negare che il contrario è sempre vero; così “Io sto mentendo” diventa: “Non è vero di tutte le proposizioni che o io non le sto affermando o sono vere;” in altre parole: “Non è vero per tutte le proposizioni p che se io affermo p, p è vera.” Il paradosso risulta dal considerare questa affermazione come se affermasse una proposizione, che deve quindi rientrare nel campo di applicazione della affermazione. Questo, però, rende evidente che la nozione di “tutte le proposizioni” è illegittima; perché altrimenti, ci devono essere proposizioni (come quelle di cui sopra) che riguardano tutte le proposizioni, e tuttavia non possono, senza contraddizione, essere incluse tra le proposizioni che le riguardano. Qualunque cosa supponiamo essere la totalità delle proposizioni, le affermazioni su questa totalità generano nuove proposizioni che, a costo di una contraddizione, devono trovarsi al di fuori della totalità. Questo è inutile per ingrandire la totalità, perché questo allarga ugualmente il campo delle affermazioni circa la totalità. Quindi non ci deve essere nessuna totalità di proposizioni, e “tutte le proposizioni” deve essere una frase priva di senso.
(2) In questo caso, la classe w è definita con riferimento a “tutte le classi”, e quindi si rivela essere una fra le classi. Se noi cerchiamo aiuto ritenendo che nessuna classe è un membro di se stessa, allora w diventa la classe di tutte le classi, e dobbiamo decidere che questa non è un membro di se stessa, i. e., non è una classe. Questo è possibile solo se non esiste un oggetto come la classe di tutte le classi nel senso richiesto dal paradosso. Che non esista nessuna di tali classi risulta dal fatto che, se supponiamo che esista, la supposizione da’ immediatamente luogo (come nella contraddizione di cui sopra) a nuove classi che si trovano al di fuori del presunto totale di tutte le classi.
(3) Questo caso è esattamente analoga alla (2), e dimostra che non si può legittimamente parlare di “tutte le relazioni.”
(4) “Il minore intero non nominabile in meno di diciannove sillabe” coinvolge la totalità dei nomi, perché è “il minimo intero tale che tutti i nomi o non si applicano ad esso o hanno più di diciannove sillabe.” Qui si assume, per ottenere la contraddizione, che una frase che contiene “tutti i nomi” è essa stessa un nome, anche se appare dalla contraddizione che non può essere uno dei nomi che si supporrebbe essere tutti i nomi che esistono. Quindi “tutti i nomi” è una nozione illegittima.
(5) Questo caso, analogamente, mostra che “tutte le definizioni” è una nozione illegittima.
(6) Questo è risolto, come la (5), osservando che “tutte le definizioni” è una nozione illegittima. Quindi il numero E non è definito in un numero finito di parole, non essendo in realtà definito affatto. *
* Cf. “Les paradoxes de la logique,” dall’autore, Revue de Metaphysique et de Morale, settembre, 1906, p. 645.
(7) la contraddizione di Burali-Forti mostra che “tutti gli ordinali” è una nozione illegittima; perché se non lo fosse, tutti gli ordinali in ordine di grandezza formerebbero serie ben ordinate, che dovrebbe avere un numero ordinale maggiore di tutti gli ordinali.
Così tutte le nostre contraddizioni hanno in comune l’assunzione di una totalità in modo tale che, se fosse legittima, sarebbe immediatamente ampliata da nuovi membri definiti in termini di se stessi.
Questo ci porta alla regola: “Qualunque cosa comporta tutto di un insieme di termini non può essere un termine dell’insieme;” o, al contrario: “Se, purché un certo insieme abbia un totale, avesse membri solo definibile in termini di quel totale, allora detto insieme non ha un totale.” †
† Quando dico che un insieme non ha totale, voglio dire che le affermazioni su tutti i suoi membri non hanno senso. Inoltre, si vedrà che l’uso di questo principio richiede la distinzione fra tutto e qualche considerati nella sezione II.
Il principio di cui sopra è, tuttavia, puramente negativo nel suo campo di validità. E’ sufficiente mostrare che molte teorie sono sbagliate, ma non si vede come gli errori debbano essere rettificati. Non possiamo dire: “Quando parlo di tutte le proposizioni, intendo tutte tranne quelle in cui sono menzionate ‘tutte le proposizioni’;” perché in questa dimostrazione abbiamo menzionato le proposizioni in cui vengono menzionate tutte le proposizioni, a cui non possiamo farlo con significato. E ‘impossibile evitare di menzionare una cosa che non vogliamo dire. Si potrebbe così, nel parlare con un uomo con un lungo naso, dire: «Quando parlo di nasi, ad eccezione di quelli che sono eccessivamente lunghi,” che non sarebbe uno sforzo di grande successo per evitare una spiacevole topica. Quindi è necessario, se non vogliamo venire meno al principio negativo di cui sopra, per costruire la nostra logica, senza menzionare certe cose come “tutte le proposizioni” o “tutte le proprietà”, e senza nemmeno dover dire che noi escludiamo queste cose. L’esclusione deve risultare naturalmente e inevitabilmente dalle nostre dottrine positive, che devono rendere chiaro che “tutte le proposizioni” e “tutte le proprietà” sono frasi prive di senso.
La prima difficoltà che ci sta di fronte sono i principi fondamentali della logica conosciuti sotto il nome caratteristico di “leggi del pensiero.” “Tutte le proposizioni sono vere o false”, per esempio, è diventata priva di senso. Se avesse significato, sarebbe una proposizione, e risulterebbe sotto il suo stesso campo di applicazione.
Tuttavia, qualche sostituto deve essere trovato, o tutte le relazioni generali della deduzione diventerebbero impossibili.
Un’altra difficoltà più particolare è illustrata dal caso particolare dell’induzione matematica. Vogliamo essere in grado di dire: “Se n è un numero intero finito, n ha tutte le proprietà possedute da 0 e dai successori di tutti i numeri che le possiedono” Ma qui “tutte le proprietà” deve essere sostituita da qualche altra frase non soggetta alle stesse obiezioni. Si potrebbe pensare che “tutte le proprietà possedute da 0 e dai successori di tutti i numeri che le possiedono” potrebbe essere legittima anche se “tutte le proprietà” non lo fossero. Ma in realtà non è così. Troveremo che frasi del tipo “tutte le proprietà che ecc.” che coinvolgono tutte le proprietà di cui l’”ecc.” può essere con significato sia affermato sia negato, e non solo quelle che in realtà hanno qualsiasi caratteristica che sia in esame; perché, nella assenza di un catalogo delle proprietà che hanno questa caratteristica, una affermazione su tutto ciò che ha la caratteristica deve essere ipotetica, e nella forma: “E ‘sempre vero che, se una proprietà ha detta caratteristico, allora, ecc.”. Così l’induzione matematica è, prima facie, incapace di essere significativamente enunciata, se “tutte le proprietà” è una frase priva di senso. Questa difficoltà, come vedremo più avanti, può essere evitata; per il momento dobbiamo considerare le leggi della logica, dal momento che queste sono molto più fondamentali.
II.
Tutto e qualche.
Data una asserzione contenente una variabile x, diciamo “x = x”, possiamo affermare che questo vale in tutti i casi, o potremmo affermare uno qualsiasi di questi casi senza stabilire riguardo a quale caso stiamo facendo un’asserzione. La distinzione è più o meno la stessa di quella tra l’enunciato generale e il particolare in Euclide. L’enunciato generale ci dice qualcosa circa (diciamo) tutti i triangoli, mentre quello particolare assume un triangolo, e afferma la stessa cosa di questo singolo triangolo. Ma il triangolo assunto è un qualsiasi triangolo, non qualche triangolo specifico; e quindi anche se, in tutta la dimostrazione, viene trattato un solo triangolo, tuttavia la dimostrazione mantiene la sua generalità. Se diciamo: “Sia ABC un triangolo, quindi i lati AB, AC sono presi insieme maggiori del lato BC,” stiamo dicendo qualcosa su un triangolo, non su tutti i triangoli; ma il singolo triangolo in questione è assolutamente ambiguo, e la nostra affermazione è di conseguenza anche assolutamente ambigua. Noi non affermiamo una qualsiasi proposizione definita, ma una indeterminata di tutte le proposizioni derivanti dal supporre ABC essere questo o quel triangolo. Questa nozione di affermazione ambigua è molto importante, ed è fondamentale non confondere un’affermazione ambigua con l’affermazione definita che la stessa cosa vale in tutti i casi.
La distinzione tra (1) che afferma qualsiasi valore di una funzione proposizionale, e (2) che afferma che la funzione è sempre vera, è presente in tutta la matematica, come nella distinzione di Euclide di enunciati generali e particolari. In qualsiasi catena di ragionamento matematico, gli oggetti le cui proprietà sono in fase di studio sono gli argomenti per ogni valore di una funzione proposizionale.
Prendete come esempio la seguente definizione:
“Chiamiamo f (x) continua per x = α se, per ogni numero σ positivo, diverso da 0, esiste un numero positivo ε, diverso da 0, tale che, per tutti i valori di δ numericamente minori di ε, la differenza f (α + δ) – f (α) è numericamente inferiore a σ. ”
Qui la funzione f è una qualsiasi funzione per la quale l’affermazione di cui sopra ha un significato; l’affermazione è intorno ad f, e varia al variare di f. Ma l’affermazione non riguarda σ o ε o δ, perché sono interessati tutti i possibili valori di questi, non un valore indeterminato. (A proposito di ε, l’affermazione “esiste un numero positivo ε tale che ecc.” è la negazione che la negazione di “eccetera” sia vera per tutti i numeri positivi.) Per questo motivo, quando un qualsiasi valore di una funzione proposizionale è asserito, l’argomento (per esempio, f nel caso di cui sopra) è chiamata variabile reale; mentre, quando una funzione si dice che è sempre vera, o che non sia sempre vera, l’argomento è chiamato variabile apparente. * Così nella definizione di cui sopra, f è una variabile reale, e σ, ε, δ sono variabili apparenti.
* Questi due termini sono dovuti al Peano, che li utilizza pressappoco nel senso di cui sopra. Cfr, e. g., Formulaire Mathématique, vol. IV, p. 5 (Torino, 1903).
Quando affermiamo un qualsiasi valore di una funzione proposizionale, diremo semplicemente che noi asseriamo una funzione proposizionale. Quindi se noi enunciamo la legge di identità nella forma “x = x,” stiamo affermando la funzione “x = x” i. e., la stiamo affermando per qualsiasi valore di questa funzione. Allo stesso modo si può dire negare una funzione proposizionale quando neghiamo qualsiasi caso di essa. Possiamo solo in verità affermare una funzione proposizionale se, qualunque sia il valore che scegliamo, quel valore è vero; allo stesso modo possiamo solo in verità negarla se, qualunque sia il valore che scegliamo, questo valore è falso. Quindi nel caso generale, in cui alcuni valori sono veri e alcuni falsi, non possiamo né affermare né negare una funzione proposizionale. †
† MacColl parla di “proposizioni”, divise in tre classi certe, variabili, e impossibili. Possiamo accettare questa divisione in riferimento alle funzioni proposizionali. Una funzione che può essere affermata è certa, una che può essere negata è impossibile, e tutte le altre sono (nel senso di Mr. MacColl) variabili.
Se φx è una funzione proposizionale, noi indichiamo con “(x). φx” la proposizione “φx è sempre vera.” Allo stesso modo “(x, y). φ (x, y)” significherà “φ (x, y) è sempre vera,” e così via. Quindi la distinzione tra l’affermazione di tutti i valori e l’affermazione di qualche valore è la distinzione tra (1) che afferma (x). φx e (2) che afferma φx dove x è indeterminata. Quest’ultima si differenzia dalla precedente in quanto non può essere trattata come una proposizione definita.
La distinzione tra affermare φx e affermare (x). φx è stata, credo, per la prima volta sottolineata da Frege. ‡
‡ Vedere il suo Grundgesetze der Arithmetik, vol. I (Jena, 1893), § 17, p. 31.
La sua ragione per introdurre esplicitamente la distinzione era la stessa che era stata la causa ad essere presente nella pratica dei matematici; vale a dire, che la deduzione può essere effettuata solo con variabili reali, non con variabili apparenti. Nel caso delle dimostrazioni di Euclide, questo è evidente: abbiamo bisogno di (diciamo) un qualche triangolo ABC per ragionarci su, anche se non importa di quale triangolo si tratti.
Il triangolo ABC è una variabile reale; e sebbene sia un triangolo qualsiasi, esso sussiste come la stesso triangolo in tutto il ragionamento. Ma nell’enunciazione generale, il triangolo è una variabile apparente. Se ci atteniamo alla variabile apparente, non possiamo effettuare nessuna deduzione, e questo è il motivo per cui in tutte le dimostrazioni, devono essere utilizzate le variabili reali. Supponiamo, per prendere il caso più semplice, che sappiamo “‘φx è sempre vera,” i. e. “(x). φx,” e sappiamo “φx implica sempre ψx,” ovvero “(x). {φx implica ψx}.” Come possiamo inferire “ψx è sempre vera”, cioè “(x) .ψx?” Sappiamo che è sempre vero che se φx è vera, e se φx implica ψx, allora ψx è vera.
Ma non abbiamo nessuna premessa secondo cui se φx è vero allora φx implica ψx; quello che abbiamo è: φx è sempre vero, e φx implica sempre ψx. Al fine costruire la nostra deduzione, dobbiamo andare da φx è sempre vero “a φx, e da” φx implica sempre ψx “a” φx implica ψx, “dove la x, pur restando un qualsiasi possibile argomento, deve essere lo stesso in entrambi. Allora, da “φx” e “φx implica ψx,” deduciamo “ψx;” così ψx è vera per ogni possibile argomento, e quindi è sempre vera. Così per dedurre “(x). ψx da” (x). φx “e” (x). {φx implica ψx}, “dobbiamo passare dalla variabile apparente alla variabile reale, e poi di nuovo alla variabile apparente. Questa procedura è necessaria in ogni ragionamento matematico che procede dalla affermazione di tutti i valori di una o più funzioni proposizionali all’affermazione di tutti i valori di qualche altra funzione proposizionale, come, ad esempio, da “tutti i triangoli isosceli hanno uguali gli angoli alla base” a “tutti i triangoli aventi angoli uguali alla base sono isosceli.” In particolare, questo processo è necessario a dimostrare Barbara e gli altri stati del sillogismo.
In una sola parola, qualsiasi deduzione opera con variabili reali (o con costanti).
Si potrebbe supporre che potremmo fare a meno del tutto delle variabili apparenti, accontentandoci di qualche come un sostituto per tutti. Questo, tuttavia, non è il caso. Prendiamo, per esempio, la definizione della funzione continua citata sopra: in questa definizione σ, α e δ devono essere variabili apparenti. Variabili apparenti sono costantemente richieste per le definizioni. Prendiamo, ad esempio, la seguente: “. Un intero è chiamato primo quando non ha fattori interi tranne 1 e se stesso”
Questa definizione implica inevitabilmente una variabile apparente nella forma: “Se n è un numero intero diverso da 1 o dal numero intero dato, n non è un fattore del numero intero dato, per tutti i possibili valori di n”.
La distinzione tra o tutti e qualche è, dunque, necessaria al ragionamento deduttivo, e si verifica in ogni parte della matematica; però, per quanto ne so, la sua importanza è rimasta non notata fino a che Frege la indicò.
Per i nostri scopi ha una utilità diversa, che è molto grande. Nel caso di certe variabili quali proposizioni o proprietà, “qualsiasi valore” è legittimo, anche se “tutti i valori” non lo è. Così possiamo dire: “p è vera o falsa, dove p è una qualsiasi proposizione,” anche se non possiamo dire “tutte le proposizioni sono vere o false.” La ragione è che, nel primo caso , ci limitiamo ad affermare una affermazione indeterminata delle proposizioni nella forma “p è vera o falsa”, mentre nel secondo si afferma (se non altro) una nuova proposizione, diversa da tutte le proposizioni con la forma “p è vera o falsa.” Così possiamo ammettere “qualsiasi valore” di una variabile nei casi in cui “tutti i valori” condurrebbero ad errori riflessivi; perché l’ammettere “qualsiasi valore” non crea nello stesso modo nuovi valori. Quindi le leggi fondamentali della logica possono venir stabilite in merito a qualsiasi proposizione, anche se non possiamo dire in modo sensato che esse sono coerenti con tutte le proposizioni. Queste leggi hanno, per così dire, un particolare enunciato, ma non un enunciato generale. Non esiste una proposizione che è (ad esempio) la legge di contraddizione; esistono solo i vari casi della legge. Di qualsiasi proposizione p, possiamo dire: “p e non-p non possono essere entrambe vere,” ma non esiste una certa proposizione come: “Ogni proposizione p è tale che p e non-p non possono essere entrambe vere. ”
Una spiegazione simile vale per le proprietà. Si può parlare di qualsiasi proprietà di x, ma non di tutte le proprietà, perché nuove proprietà potrebbero essere generate in tal modo. Così possiamo dire: “Se n è un numero intero finito, e se 0 ha la proprietà φ, e m + 1 ha la proprietà φ a condizione che m l’abbia, ne consegue che n ha la proprietà φ.” Qui non abbiamo bisogno di specificare φ; φ sta per “qualsiasi proprietà.”
Ma non possiamo dire: “Un intero finito è definito come un numero che ha ogni proprietà φ posseduta da 0 e dai successori dei possessori.” Perché qui è essenziale prendere in considerazione ogni proprietà, * non qualsiasi proprietà; e nell’uso di tale definizione si assume che esso comprende una proprietà distintiva di interi finiti, che è proprio il tipo di presupposto da cui, come abbiamo visto, nascono le contraddizioni riflessive.
* Questo è indistinguibile da “tutte le proprietà”.
Nel caso di cui sopra, è necessario evitare i suggerimenti del linguaggio ordinario, che non è adatto per esprimere la distinzione necessaria. Il punto può essere illustrato ulteriormente come segue: Se l’induzione deve essere utilizzata per definire interi finiti, un’induzione deve indicare una proprietà definita di numeri interi finiti, non una proprietà ambigua. Ma se φ è una variabile reale, l’affermazione “n ha la proprietà φ a condizione che questa proprietà sia posseduta da 0 e dai successori dei possessori” assegna a n una proprietà che varia al variare di φ, e una tale proprietà non può essere utilizzata per definire la classe dei numeri interi finiti. Vogliamo dire: “‘n è un numero intero finito’ significa: ‘. Qualunque possa essere la proprietà φ, n ha la proprietà φ a condizione che φ sia posseduto da 0 e dai successori dei possessori'” Ma qui φ è diventata una variabile apparente. Per averla come variabile reale, dovremmo dire: “Qualunque possa essere la proprietà φ, ‘n è un numero intero finito’ significa: ‘n ha la proprietà φ considerato che φ è posseduta da 0 e dai successori dei possessori.'” Ma qui il significato di ‘n è un numero intero finita’ varia al variare di φ, e quindi una tale definizione è impossibile. Questo caso illustra un punto importante, vale a dire quanto segue: “. * L’ambito di una variabile reale non può mai essere minore della intera funzione proposizionale nell’affermazione della quale si afferma che tale variabile si verifica” Cioè, se la nostra funzione proposizionale è (diciamo) “φx implica p,” l’affermazione di questa funzione significa “qualsiasi valore di φx implica che p ‘è vero,” non “‘ ogni valore di φx è vero ‘implica p.” In quest’ultimo, abbiamo realmente “tutti i valori di φx sono veri”, e la x è una variabile apparente.
* L’ambito di una variabile reale è l’intera funzione di cui “qualsiasi valore” è in questione. Così nella “φx implica p ” l’ambito di x non è φx, ma” φx implica p”.
III.
Il significato e il campo delle Proposizioni Generalizzate.
In questa sezione dobbiamo considerare dapprima il significato delle proposizioni in cui la parola tutto si presenta, e poi il tipo di raccolte che ammettono proposizioni riguardanti tutti i loro membri.
È conveniente dare il nome proposizioni generalizzate non solo a quelle che contengono tutto, ma anche a quelle che contengono qualche (non definito). La proposizione “φx è a volte vera” è equivalente alla negazione di “non-φx è sempre vero,” “qualche ‘A è B” è equivalente alla negazione di “tutti gli A non sono B;”, ovvero di “nessun A è B. “Se è possibile trovare le interpretazioni che contraddistinguono” φx è talvolta vera ” dalla negazione di” non-φx è sempre vero, “non è necessario fare indagini; per i nostri scopi possiamo definire” φx a volte è vero “, come la negazione di “non-φx è sempre vero.” In ogni caso, i due tipi di proposizioni richiedono lo stesso tipo di interpretazione, e sono soggette alle stesse limitazioni.
In ognuna vi è una variabile apparente; ed è la presenza di una variabile apparente che costituisce ciò che io intendo per una proposizione generalizzata. (Si noti che non può esistere una variabile reale in una qualsiasi proposizione; perché quello che contiene una variabile reale è una funzione proposizionale, non una proposizione-)
La prima domanda che dobbiamo porci in questa sezione è: Come dobbiamo interpretare la parola tutti in certe proposizioni come “tutti gli uomini sono mortali?” A prima vista, si potrebbe pensare che non ci sarebbe nessuna difficoltà, che “tutti gli uomini” sia un’idea perfettamente chiara, e che diciamo di tutti gli uomini è che sono mortali. Ma su questo punto di vista ci sono molte obiezioni.
(1) Se questo punto di vista fosse corretto, sembrerebbe che “tutti gli uomini sono mortali” non sarebbe vero se non ci fossero uomini. Eppure, come il signor Bradley ha messo in evidenza, “I trasgressori saranno perseguiti” * può essere perfettamente vero anche se nessuno trasgredisce; e quindi, come egli sostiene ulteriormente, siamo spinti ad interpretare tali proposizioni come proposizioni ipotetiche, che significano “se qualcuno trasgredisce, sarà perseguito;” i. e., “se x trasgredisce, x sarà perseguito”, in cui la gamma di valori che x può avere, qualunque esso sia, non è certamente limitato a coloro che realmente trasgrediscono. Allo stesso modo “tutti gli uomini sono mortali” si intende “se x è un uomo, x è mortale, dove x può avere qualsiasi valore entro un certo intervallo.” Quale sia questo intervallo, resta da determinare; ma in ogni caso è più ampio di “uomini”, perché la proposizione ipotetica di cui sopra è certamente spesso vera quando x non è un uomo.
* Logica, Parte I, capitolo II.
(2) “Tutti gli uomini” è una locuzione denotativa; e sembrerebbe, per ragioni che ho esposte altrove, † che le locuzioni denotative non hanno alcun significato prese isolatamente, ma entrano solo come costituenti nell’espressione verbale di proposizioni che non contengono nessun componente corrispondente alle locuzioni denotative in questione. Vale a dire, una locuzione denotativa è definito mediante le proposizioni in cui una espressione verbale si verifica. Quindi è impossibile che queste proposizioni acquisiscano il loro significato attraverso le locuzioni denotative; dobbiamo trovare un’interpretazione indipendente delle proposizioni contenenti tali locuzioni, e non deve utilizzare queste locuzioni per spiegare che cosa significano queste proposizioni. Quindi non possiamo considerare “tutti gli uomini sono mortali”, come una asserzione su “tutti gli uomini.”
† “On D”enoting. Mind, Ottobre 1905.
(3) Anche se ci fosse un certo oggetto come “tutti gli uomini”, è chiaro che non è questo l’oggetto a cui si attribuisce la mortalità quando diciamo “tutti gli uomini sono mortali.” Se stessimo attribuendo la mortalità a questo oggetto, dovremmo dire “ogni uomo è mortale.” Così l’ipotesi che esista un cero oggetto come “tutti gli uomini” non ci aiuta ad interpretare “tutti gli uomini sono mortali.”
(4) Sembra evidente che, se incontriamo qualcosa che può essere un uomo o può essere un angelo sotto mentite spoglie, si rientra nell’ambito di applicazione di “tutti gli uomini sono mortali” per affermare “se questo è un uomo, è mortale. “Così ancora una volta, come nel caso dei trasgressori, sembra chiaro che stiamo in realtà dicendo “se qualcuno è un uomo,esso è mortale”, e che la domanda se questo o quello è un uomo non rientra nell’ambito di applicazione della nostra affermazione, come avverrebbe se il tutto fosse riferito a “tutti gli uomini.”
(5) Arriviamo così al punto di vista che quello che si intende per “tutti gli uomini sono mortali” può essere più esplicitamente stabilito in una qualche forma come “è sempre vero che se x è un uomo, x è mortale.” Qui dobbiamo indagare sulla portata della parola sempre.
(6) È ovvio che sempre comprende alcuni casi in cui x non è un uomo, come abbiamo visto nel caso dell’angelo sotto mentite spoglie. Se x fosse limitato al caso in cui x è un uomo, si potrebbe dedurre che x è un mortale, poiché se x è un uomo, x è mortale. Quindi, con lo stesso significato di sempre, troveremmo “è sempre vero che x è mortale.” Ma è chiaro che, senza alterare il significato di sempre, questa nuova proposizione è falsa, anche se l’altra era vera.
(7) Si potrebbe sperare che “sempre” significhi “per tutti i valori di x.”
Ma “tutti i valori di x,” se legittima, dovrebbe includere come parti “tutte le proposizioni” e “tutte le funzioni”, e tali totalità illegittime. Quindi i valori di x devono essere in qualche modo limitati all’interno di alcuni totalità legittime. Ciò ci sembra condurre alla dottrina tradizionale di un “universo del discorso” entro cui x deve essere ritenuto che sia posto.
(8) Tuttavia, è abbastanza essenziale che dovremmo avere qualche significato di sempre, che non deve essere espresso in una ipotesi restrittiva come per x. Perché supponiamo che “sempre” significa “‘ogni volta che x appartiene alla classe i.” Allora “tutti gli uomini sono mortali” diventa “ogniqualvolta che x appartiene alla classe i, se x è un uomo, x è mortale ‘”, ovvero, «è sempre vero che se x appartiene alla classe i, allora, se x è un uomo, x è mortale.” Ma quale è il nostro significato del nuovo sempre? Non sembra che ci siano più ragioni per limitare x, in questa nuova proposizione, alla classe i, che c’erano prima per limitare alla classe dell’uomo. Così saremo portati a un nuovo universo più ampio, e così via all’infinito, a meno che non siamo in grado di scoprire qualche restrizione naturale sui possibili valori della (ad esempio, alcune restrizioni date con la) funzione “se x è un uomo, x è mortale , “e che non hanno bisogno di essere imposte dall’esterno.
(9) Sembra evidente che, dal momento che tutti gli uomini sono mortali, non ci può essere una qualsiasi proposizione falsa, che sia un valore della funzione “se x è un uomo, x è mortale.”
Perché se questa è una davvero una proposizione, l’ipotesi “x è un uomo” deve essere una proposizione, e così deve essere la conclusione “x è mortale.” Ma se l’ipotesi è falsa, l’ipotetica è vera; e se l’ipotesi è vera, l’ipotetica è vero.
Quindi ci possono essere false proposizioni nella forma “se x è un uomo, x è mortale.”
(10) Ne consegue che, se sono da escludere alcuni valori di x, possono essere solo i valori per i quali non vi è alcuna proposizione nella forma “se x è un uomo, x è mortale”, cioè, per cui questa frase è senza senso. Dal momento che, come abbiamo visto in (7), sono da escludere valori di x, ne consegue che la funzione “se x è un uomo, x è mortale” deve avere un certo campo di significato, * che è insufficiente per tutti i valori immaginabili di x, sebbene superi i termini che sono gli uomini. La restrizione su x è pertanto una restrizione sulla gamma di significato della funzione “se x è un uomo, x è mortale.”
- Una funzione si dice che sia significativa per l’argomento x se ha un valore con questo argomento. Così possiamo dire in breve “φx è significativo,” che significa “la funzione φ ha un valore per l’argomento x.” L’area di significato di una funzione consiste di tutti i termini per i quali la funzione è vera, insieme a tutti i termini per cui è falsa.
(11) Si giunge quindi alla conclusione che “tutti gli uomini sono mortali” significa “se x è un uomo, x è mortale, sempre”, dove sempre significa”per tutti i valori della funzione ‘se x è un uomo, x è mortale . “‘Questa è una limitazione interna su x, data dalla natura della funzione; ed è una limitazione che non richiede una regola esplicita, poiché è impossibile per una funzione essere vera in modo più generale che per tutti i suoi valori. Inoltre, se il campo di significato della funzione è i, la funzione “se x è una i, allora se x è un uomo, x è mortale” ha lo stesso campo di significato, dal momento che non può essere significativa a meno che il suo costituente “se x è un uomo, x è mortale ” sia significativo. Ma qui il campo di significato è ancora implicito, come lo era in ‘se x è un uomo, x è mortale;’ quindi non possiamo costituire campi di significato espliciti, poiché il tentativo di farlo solo dà luogo ad una nuova proposizione in cui lo stesso campo di significato è implicito.
Così in generale: “. (x) φx” significa “φx sempre.” Questo può essere interpretato, anche se con meno esattezza, come “φx è sempre vero”, o, più esplicitamente: “Tutte le proposizioni della forma φx sono vere,” o “Tutti i valori della funzione φx sono veri.” † Così il fondamentale tutto è “tutti i valori di una funzione proposizionale,” ed ogni altro tutto è derivato da questo. Ed ogni funzione proposizionale ha un certo campo di significato, all’interno del quale si trovano gli argomenti per i quali la funzione ha dei valori. All’interno di questo campo di argomenti, la funzione è vera o falsa; fuori di questo intervallo, è un nonsenso.
† Una adatta espressione linguistica espressione di questa idea è: “φx è vero per tutti i possibili valori di x,” un possibile valore essendo inteso come quello per il quale φx ha significato.
L’argomentazione di cui sopra può essere sintetizzata come segue:
La difficoltà che affligge i tentativi di limitare la variabile è, che le restrizioni naturalmente si esprimono come ipotesi che la variabile è di un tale o di un tal altro genere, e che, quando così espressa, l’ipotetico risultato è esente dalla restrizione prevista. Ad esempio, tentiamo di limitare la variabile agli uomini, e affermare che, sotto tale restrizione, “, x è mortale” è sempre vero. Allora quello che è sempre vero è che se x è un uomo, x è mortale; e questa ipotesi vale anche quando x non è un uomo. Così una variabile non può mai essere limitato entro un certo intervallo se la funzione proposizionale in cui si verifica la variabile rimane significativa quando la variabile è fuori di tale intervallo. Ma se la funzione cessa di avere significato quando la variabile va fuori di un certo intervallo, allora la variabile è ipso facto limitata a tale intervallo, senza la necessità di alcuna regola esplicita in tal senso. Questo principio è da tenere presente nello sviluppo di tipi logici, a cui si procederà tra breve.
Ora possiamo cominciare a vedere come avviene che “tutto è così-e-così” è a volte una frase legittima e talvolta no. Supponiamo che diciamo “tutti i termini che hanno la proprietà φ hanno la proprietà ψ.” Questo significa che, secondo l’interpretazione di cui sopra, “φx implica sempre ψx.” A condizione che la gamma di significatività del φx sia la stessa di quella di ψx, questa affermazione è significativa; quindi, data una qualsiasi definita funzione φx, esistono proposizioni su “tutti i termini che soddisfano φx.”
Ma a volte capita (come vedremo meglio in seguito) che ciò che appare verbalmente come una funzione è in realtà molte funzioni analoghe con diversi campi di significato. Ciò si applica, per esempio, a “p è vero”, che, scopriremo, non è in realtà una funzione di p, ma è diverse funzioni a seconda del tipo di proposizione che sarà p. In tal caso, la frase che esprime la funzione ambigua può, a causa della ambiguità, essere significativa per tutta una serie di valori dell’argomento che eccede l’intervallo di significatività di una qualsiasi funzione. In tal caso, non tutto è legittima. Quindi se proviamo a dire “tutte le proposizioni vere hanno la proprietà φ,” ovvero “‘p’ vero ‘implica sempre φp,” i possibili argomenti di’ p è vero ‘necessariamente superano i possibili argomenti per φ, e quindi il tentativo di una regola generale è impossibile. Per questo motivo, vere regole generali su tutte le proposizioni vere non possono essere costruite. Può accadere, tuttavia, che la supposta funzione φ è davvero ambigua come ‘p è vera;’ e se capita di avere una ambiguità esattamente dello stesso tipo di quella di ‘p è vero,’ potremmo essere in grado sempre di dare un’interpretazione alla proposizione “‘p è vero’ implica φp.” Questo si verificherà, ad esempio, se φp è “non-p è falsa.” Così otteniamo un apparenza, in tali casi, di una proposizione generale riguardante tutte le proposizioni; ma questa apparenza è dovuta ad una ambiguità sistematica su parole come vero e falso. (Questa ambiguità sistematica deriva dalla gerarchia delle proposizioni che verrà spiegata più avanti). Possiamo, in tutti questi casi, porre la nostra regola su qualsiasi proposizione, dal momento che il significato delle parole ambigue si adatterà a qualsiasi proposizione. Ma se volgiamo la nostra proposizione in una variabile apparente, e diciamo qualcosa su tutto, dobbiamo supporre le parole ambigue fissate a questo o quel possibile significato, anche se può essere abbastanza irrilevante quale dei loro possibili significati debbano avere. Questo è quanto succede sia che tutto abbia dei limiti che escludono “tutte le proposizioni,” e che ci sembrano comunque essere affermazioni vere su “tutte le proposizioni.” Entrambi questi punti diventeranno più chiari quando la teoria dei tipi sarà stata spiegata.
Si è spesso ipotizzato * che ciò che è richiesto in modo che possa essere legittimo parlare di tutto di un insieme sia che l’insieme dovrebbe essere finita.
Così “tutti gli uomini sono mortali” sarà legittimo perché gli uomini formano una classe finita.
Ma questo non è davvero il motivo per cui possiamo parlare di “tutti gli uomini.” Quello che è essenziale, come risulta dalla discussione di cui sopra, non è finitezza, ma quello che può essere chiamato l’omogeneità logica. Questa proprietà è di appartenere a qualsiasi insieme i cui termini sono tutti contenuti all’interno del campo di significato di una qualche funzione.
Sarebbe sempre evidente a colpo d’occhio se un insieme contenga questa proprietà o no, se non fosse per l’ambiguità nascosta nei termini logici comuni come vero e falso, che conferiscono un aspetto di essere una sola funzione a ciò che è veramente un agglomerato di molte funzioni con diversi intervalli di significato.
Le conclusioni di questa sezione sono le seguenti: ogni proposizione contenente tutto afferma che una qualche funzione proposizionale è sempre vera; e questo significa che tutti i valori di detta funzione sono veri, non che la funzione è vera per tutti gli argomenti, dal momento che ci sono argomenti per i quali una determinata funzione è priva di significato, ovvero, non ha alcun valore. Quindi si può parlare di tutto di un insieme quando e solo quando l’insieme forma parte di tutto l’insieme del campo di significato di una qualche funzione proposizionale, l’intervallo di significatività essendo definito come l’insieme di quegli argomenti per cui la funzione in questione è significativa , ovvero, ha un valore.
* E. g., M. Poincaré, Revue de Métaphysique et de Morale, Mai 1906.
IV.
La Gerarchia dei tipi.
Un tipo è definito come l’intervallo di significatività di una funzione proposizionale, i. e., come l’insieme degli argomenti per cui detta funzione ha valori.
Ogni volta che si presenta una variabile apparente in una proposizione, l’intervallo dei valori della variabile apparente è un tipo, il tipo essendo fissato dalla funzione per cui “tutti i valori” sono interessati. La divisione degli oggetti in tipi è resa necessaria dalle fallacie riflessive che altrimenti si presentano. Questi errori, come abbiamo visto, sono da evitare da quello che può essere chiamato il “principio del circolo vizioso;” cioè “nessuna totalità può contenere membri definiti in termini di sé stesso”. Questo principio, nel nostro linguaggio tecnico, diventa: “Qualunque cosa contenga una variabile apparente non deve essere un possibile valore di tale variabile.” Così qualunque cosa contenga una variabile apparente deve essere di un tipo diverso dai possibili valori di quella variabile; diremo che si tratta di un tipo più elevato. Così le variabili apparenti contenute in una espressione sono ciò che determina il suo tipo. Questo è il principio guida nel seguito.
Le proposizioni che contengono le variabili apparenti sono generati da quelle che non contengono queste variabili apparenti da processi di cui uno è sempre il processo di generalizzazione,ovvero, la sostituzione di una variabile in uno dei termini di una proposizione, e l’affermazione della funzione risultante per tutti i possibili valori della variabile. Quindi una proposizione è chiamata proposizione generalizzata quando contiene una variabile apparente. Chiameremo una proposizione che non contenga nessuna variabile apparente una proposizione elementare. E’ chiaro che una proposizione contenente una variabile apparente presuppone altre da cui può essere ottenuta per generalizzazione; quindi tutte le proposizioni generalizzate presuppongono proposizioni elementari. In una proposizione elementare possiamo distinguere uno o più termini da uno o più concetti; i termini sono tutto ciò che può essere considerato come il soggetto della proposizione, mentre i concetti sono i predicati o relazioni affermate da questi termini * Chiameremo i termini di proposizioni elementari particolari; questi costituiscono il primo o tipo di più basso livello.
* Vedi Principles of di Mathematics, § 48.
Non è necessario, in pratica, sapere quali oggetti appartengano al tipo di più basso livello, o anche se il tipo di variabile più basso che si presenta in un determinato contesto è quello di particolari o qualche altra cosa. Perché in pratica solo i tipi relativi alle variabili sono rilevanti; così il tipo più basso che si verifica in un determinato contesto può essere chiamato quello dei particolari, per quanto tale contesto è interessato. Ne consegue che la considerazione di cui sopra dei particolari non è essenziale alla verità di ciò che segue; tutto ciò che è essenziale è il modo in cui altri tipi sono generati da particolari, in qualsiasi modo il tipo di particolari possa essere costituito.
Applicando il processo di generalizzazione ai particolari che si presentano in proposizioni elementari, otteniamo nuove proposizioni. La legittimità di questo processo richiede solo che nessun particolare sia una proposizione. Che questo sia così, sarà assicurato dal significato che diamo alla parola particolare. Possiamo definire un particolare come qualcosa privo di complessità; non è quindi ovviamente una proposizione, poiché le proposizioni sono fondamentalmente complesse. Quindi, nell’applicare il processo di generalizzazione ai particolari non corriamo alcun rischio di incorrere in errori riflessivi.
Chiameremo proposizioni del primo ordine le proposizioni elementari insieme con quelle che contengono solo particolari come variabili apparenti. Queste costituiscono il secondo tipo logico.
Abbiamo così una nuova totalità, quella delle proposizioni del primo ordine. Possiamo quindi formare nuove proposizioni in cui proposizioni di primo ordine si verificano come variabili apparenti. Chiameremo queste proposizioni del secondo ordine; queste costituiscono il terzo tipo logico. Così, ad esmpio, se Epimenide afferma “tutte le proposizioni del primo ordine affermate da me sono false”, asserisce una proposizione del secondo ordine; egli può asserire questo veramente, senza asserire in verità alcuna proposizione del primo ordine, e quindi si pone alcuna contraddizione.
Il suddetto processo può essere continuato all’infinito. L’n + 1 esimo tipo logico sarà costituito da proposizioni di ordine n, che saranno tali da contenere proposizioni di ordine n – 1, ma nessuna di ordine superiore, come variabili apparenti. I tipi così ottenuti sono mutuamente esclusivi, e quindi non sono possibili fallacie riflessive purché ci ricordiamo che una variabile apparente deve essere sempre confinata all’interno di un certo tipo.
In pratica, una gerarchia di funzioni è più utile di una di proposizioni. Funzioni di vari ordini possono essere ottenute da proposizioni di vari ordini con il metodo della sostituzione. Se p è una proposizione, e a un costituente di p, assumiamo che “p / a; x” indichi la proposizione che deriva dalla sostituzione di x con αa ovunque a si verifica in p. Allora p / a, che chiameremo una matrice, può prendere il posto di una funzione; il suo valore per l’argomento x è p / a α; x, e il suo valore per l’argomento a è p. Allo stesso modo, se “p / (a, b); (x, y)” indica il risultato della prima sostituendo x con a e quindi sostituendo y con b, possiamo utilizzare la matrice doppia p / (α, b) per rappresentare un funzione doppia. In questo modo possiamo evitare variabili apparenti diverse dai particolari e le proposizioni di vari ordini.
L’ordine di una matrice viene definita come l’ordine della proposizione in cui la sostituzione è effettuata, proposizione che chiameremo il prototipo.
L’ordine di una matrice non determina il tipo: in primo luogo perché non determina il numero di argomenti con cui gli altri devono essere sostituiti (cioè, se la matrice è della forma p / a o p / a, b ) o p / (a, b, c), ecc.); in secondo luogo, perché, se il prototipo è più elevato del primo ordine, gli argomenti possono essere sia proposizioni sia particolari. Ma è chiaro che il tipo di matrice è sempre definibile mediante la gerarchia delle proposizioni.
Anche se è possibile sostituire funzioni con matrici, e anche se questa procedura introduce una certa semplicità nella spiegazione dei tipi, è tecnicamente scomodo. Tecnicamente, è utile sostituire il prototipo p con φa, e sostituire p/a; x con φx; così dove, se venissero impiegate le matrici, p e a apparirebbero come variabili apparenti, ora abbiamo φ come la nostra variabile apparente. Affinché φ possa essere legittima come variabile apparente, è necessario che i suoi valori siano limitati a proposizioni di un certo tipo.
Quindi si procede come segue.
Una funzione il cui argomento è un particolare e il cui valore è sempre una proposizione del primo ordine sarà chiamata funzione del primo ordine. Una funzione che riguarda una funzione di primo ordine o una proposizione come variabile apparente sarà chiamata una funzione di secondo ordine, e così via. Una funzione di una variabile che è dell’ordine immediatamente superiore a quello dei suoi argomenti sarà chiamata funzione predicativa; lo stesso nome sarà dato ad una funzione di più variabili se esiste tra queste variabili una variabile per cui la funzione diventa predicativa quando i valori sono assegnati a tutte le altre variabili. Allora il tipo di una funzione viene determinata dal tipo dei suoi valori e il numero e dal tipo dei suoi argomenti.
La gerarchia delle funzioni può essere ulteriormente spiegata come segue. Una funzione di primo ordine di un particolare x sarà indicata con φ! x (le lettere ψ, χ, θ, f, g, F, G saranno utilizzate anche per le funzioni). Nessuna funzione di primo ordine contiene una funzione come variabile apparente; quindi tali funzioni costituiscono una totalità ben definita, e la φ in φ! x può essere trasformato in una variabile apparente. Ogni proposizione in cui φ appare come variabile apparente, e non vi è alcuna variabile apparente di tipo superiore a φ, è una proposizione del secondo ordine. Se tale proposizione contiene un particolare x, non è una funzione predicativa di x; ma se contiene una funzione di primo ordine φ, si tratta di una funzione predicativa di φ, e sarà scritta
Allora f è una funzione predicativa del secondo ordine; i possibili valori di f di nuovo formano una totalità ben definita, e possiamo trasformare f in una variabile apparente. Possiamo quindi definire le funzioni predicative terzo ordine, che saranno tali da avere proposizioni del terzo ordine per i loro valori e funzioni predicative del secondo ordine per i loro argomenti. E in questo modo possiamo continuare all’infinito. Uno sviluppo esattamente simile vale per funzioni di più variabili.
Adotteremo le seguenti convenzioni. Le variabili del tipo più basso che si verificano in qualsiasi contesto saranno indicate con lettere minuscole latine (escluse f e g, che sono riservati alle funzioni); una funzione predicativa di un argomento x (dove x può essere di qualsiasi tipo) verrà indicato con φ! x (dove ψ, χ, θ, f, g, F o G possono sostituire φ); allo stesso modo una funzione predicativa di due argomenti x e y sarà indicata con φ! (x, y); una funzione generale di x sarà indicata con φ x, e una funzione generale di x e y da φ (x, y). In φx, φ non può essere costituita da una variabile apparente, dal momento che il suo tipo è indeterminato; ma in φ! x, dove φ è una funzione predicativa il cui argomento è di qualche tipo assegnato, φ può essere costituita da una variabile apparente.
E‘ importante osservare che, poiché ci sono vari tipi di proposizioni e funzioni, e dal momento che la generalizzazione può essere applicata solo all’interno di un determinato tipo, tutte le frasi che contengono le parole “tutte le proposizioni” o “tutte le funzioni” sono a prima vista senza significato, anche se in alcuni casi sono suscettibili di una interpretazione ineccepibile. Le contraddizioni nascono dall’uso di tali frasi nel caso in cui nessun significato semplice può essere trovato.
Se ora ritorniamo alle contraddizioni, vediamo subito che alcuni di esse sono risolte con la teoria dei tipi. Ovunque si parla di ”tutte le proposizioni”, dobbiamo sostituire “tutte le proposizioni di ordine n”, dove è indifferente che valore diamo alla n, ma è essenziale che n deve avere un qualche valore. Così, quando un tale dice “Io sto mentendo,” dobbiamo interpretarlo nel senso: “C’è una proposizione di ordine n, che io affermo, e che è falsa.” Questa è una proposizione di ordine n + 1; quindi l’uomo non sta affermando una qualsiasi proposizione di ordine n; quindi la sua affermazione è falsa, e tuttavia la sua falsità non implica, come quella di “Io sto mentendo” è apparso implicarlo, che sta facendo un’affermazione vera. Questo risolve la contraddizione del mentitore.
Si consideri poi “il minimo intero non nominabile in meno di diciannove sillabe.” E ‘da osservare, in primo luogo, che nominabile deve significare “nominabile per mezzo di tali e tali nomi assegnati”, e che il numero di nomi assegnati deve essere finito. Perché se non è finito, non c’è motivo per cui ci dovrebbe essere un numero intero non nominabile in meno di diciannove sillabe, e il paradosso crollerebbe. Possiamo subito dopo supporre che il “nominabile in termini di nomi della classe N” significa “essere l’unico termine che soddisfa una qualche funzione composta interamente di nomi della classe N. ” La soluzione di questo paradosso sta, credo, nella semplice constatazione che” nominabile nei termini dei nomi della classe N “non è mai in sé nominabile nei termini dei nomi di quella classe. Se allarghiamo N aggiungendo il nome “nominabile in termini dei nomi della classe N,” il nostro apparato fondamentale dei nomi viene ingrandito; chiamando il nuovo apparato N ‘, “nominabile nei termini dei nomi della classe N’ ” rimane non nominabile in termini dei nomi della classe N’. Se proviamo a ingrandire N fino a che abbracci tutti i nomi, “nominabile” diventa (da quanto si è detto sopra) “ essere l’unico termine che soddisfa una qualche funzione composta interamente di nomi.” Ma qui c’è una funzione come variabile apparente; quindi siamo confinati a funzioni predicative di un certo tipo (perché le funzioni non-predicative non possono essere variabili apparenti). Quindi dobbiamo solo osservare che la nominabilità nei termini di tali funzioni è non-predicativa per sfuggire il paradosso.
Il caso del “minimo ordinale indefinibile” è strettamente analogo al caso che abbiamo appena discusso. Qui, come prima, “definibile” deve essere relativo a qualche dato apparato di idee fondamentali; e non vi è motivo di ritenere che “definibile in termini di idee della classe N” non sia definibile in termini delle idee della classe N. Sarà vero che c’è qualche segmento definito della serie di ordinali interamente costituito di ordinali definibili, e aventi il minimo ordinale indefinibile come limite. Questo minimo ordinale indefinibile sarà definibile da un leggero allargamento del nostro apparato fondamentale; ma vi sarà poi un nuovo ordinale che sarà il minimo indefinibile con il nuovo apparato. Se allarghiamo il nostro apparato in modo da includere tutte le idee possibili, non c’è più alcun motivo per credere che non vi sia nessun ordinale indefinibile. La forza apparente del paradosso risiede in gran parte, credo, nella supposizione che, se tutti gli ordinali di una certa classe sono definibili, la classe deve essere definibile, nel qual caso il suo successore è, naturalmente, anche definibile; ma non vi è alcuna ragione per accettare questa ipotesi.
Le altre contraddizioni, quella di Burali-Forti, in particolare, richiedono alcuni ulteriori sviluppi per la loro soluzione.
V.
L’Assioma di Riducibilità.
Una funzione proposizionale di x può, come abbiamo visto, essere di qualsiasi ordine; quindi qualsiasi asserzione su “tutte le proprietà di x” è priva di significato. (Una “proprietà di x” è la stessa cosa come una “funzione proposizionale che detiene quelle di x.”), Ma è assolutamente necessario, se la matematica deve essere possibile, che dovremmo avere qualche metodo di fare affermazioni che di solito sono equivalenti a ciò che abbiamo in mente quando (in modo impreciso) parliamo di “tutte le proprietà di x.” Questa necessità si verifica in molti casi, ma soprattutto in relazione all’induzione matematica.
Possiamo dire, con l’uso di qualsiasi al posto del tutto, “Qualsiasi proprietà posseduta da 0, e dai successori di tutti i numeri che la possiedono, è posseduta da tutti i numeri finiti.” Ma non possiamo andare avanti fino a: “. Un numero finito è un numero che possiede tutte le proprietà possedute da 0 e dai successori di tutti i numeri che li possiedono” Se limitiamo questa affermazione a tutte le proprietà del primo ordine dei numeri, non possiamo dedurre che essa contiene delle proprietà del secondo ordine. Ad esempio, saremo in grado di dimostrare che, se m, n sono numeri finiti, allora m + n è un numero finito.
Infatti, con la definizione di cui sopra, “m è un numero finito” è una proprietà di secondo ordine di m; quindi il fatto che m + 0 è un numero finito, e che, se m + n è un numero finito, così sarà m + n + 1, non consente di concludere per induzione che m + n è un numero finito. È evidente che un simile stato di cose rende molto della matematica elementare impossibile.
L’altra definizione di finitezza, per la non-somiglianza di tutto e parte, non andrebbe meglio. Perché questa definizione è: “Una classe si dice finita quando ogni relazione biunivoca il cui dominio è la classe e il cui dominio inverso è contenuto nella classe ha tutta la classe per suo dominio inverso.” Qui viene visualizzata una relazione variabile, ovvero, una funzione variabile di due variabili; dobbiamo prendere tutti i valori di questa funzione, che richiede che sia di un qualche ordine assegnato; ma qualsiasi ordine assegnato non ci permetterà di dedurre molte delle proposizioni della matematica elementare.
Quindi dobbiamo trovare, se possibile, un qualche metodo per ridurre l’ordine di una funzione proposizionale senza alterare la verità o la falsità dei suoi valori.
Questo sembra essere ciò che il senso comune attua con l’accettazione delle classi. Data una qualsiasi funzione proposizionale φx, di qualsiasi ordine, questa si presume che sia equivalente, per tutti i valori di x, ad una affermazione del tipo “x appartiene alla classe α.” Ora, questa affermazione è del primo ordine, in quanto non fa alcuna allusione a “tutte le funzioni di tale e talaltro tipo.” Infatti il suo unico vantaggio pratico sull’affermazione originale φx è che è del primo ordine. Non vi è alcun vantaggio nel ritenere che in realtà ci sono oggetti come le classi, e la contraddizione sulle classi che non sono membri di se stesse dimostra che, se ci sono classi, devono essere qualcosa di radicalmente diverso dai particolari. Credo che lo scopo principale a cui servono le classi, e la ragione principale che le rende linguisticamente utili, è che esse forniscono un metodo per ridurre l’ordine di una funzione proposizionale. Io, dunque, non presumo nulla di quello che può sembrare di essere coinvolto nella ammissione del senso comune delle classi, tranne questo: che ogni funzione proposizionale è equivalente, per tutti i suoi valori, a qualche funzione predicativa.
Questa ipotesi per quanto riguarda le funzioni deve essere presa qualunque sia il tipo dei loro argomenti. Sia φx una funzione, di qualsiasi ordine, di un argomento x, che può essere esso stesso un particolare o una funzione di qualsiasi ordine.
Se φ è di ordine successivo al di sopra di x, scriviamo la funzione nella forma φ! x; in tal caso chiameremo φ funzione predicativa. Così una funzione predicativa di un particolare è una funzione del primo ordine; e per tipi superiori di argomenti, le funzioni predicative prendono il posto che le funzioni del primo ordine prendono nei confronti dei particolari. Assumiamo, quindi, che ogni funzione è equivalente, per tutti i suoi valori, a qualche funzione predicativa dello stesso argomento. Questa ipotesi sembra essere l’essenza della consueta ipotesi di classi; in ogni caso, essa conserva il maggior numero di classi che abbiamo per qualsiasi uso, e un numero piccolo abbastanza per evitare le contraddizioni che una ammissione meno riluttante sulle classi è suscettibile di comportare. Chiameremo questa ipotesi l’assioma delle classi, o l’assioma di riducibilità.
Noi ipotizzeremo analogamente che ogni funzione di due variabili è equivalente, per tutti i suoi valori, ad una funzione predicativa di tali variabili, dove una funzione predicativa di due variabili è una funzione tale che esista una delle variabili per la quale la funzione diventa predicativo (nel nostro senso precedente indicato) quando un valore viene assegnato all’altra variabile. Questa ipotesi è ciò che sembra significativo nel dire che qualsiasi affermazione circa due variabili definisce una relazione tra di loro. Chiameremo questa ipotesi l’assioma delle relazioni o l’assioma di riducibilità.
Nel trattare con le relazioni tra più di due termini, sarebbero necessarie assunzioni simili per tre, quattro, … variabili. Ma queste ipotesi non sono indispensabili per il nostro scopo, e non sono quindi considerate in questo documento.
Con l’aiuto dell’assioma di riducibilità, affermazioni su “tutte le funzioni del primo ordine di x” o “tutte le funzioni predicative di α” determina la maggior parte dei risultati che altrimenti richiederebbe “tutte le funzioni.” Il punto essenziale è che tali risultati si ottengono in tutti i casi in cui solo la verità o la falsità dei valori delle funzioni in questione sono rilevanti, come è sempre il caso in matematica.
Così l’induzione matematica, per esempio, serve ora ad essere stabilita solo per tutte le funzioni predicative di numeri; segue poi dall’assioma delle classi che appartiene a qualsiasi funzione di qualunque ordine. Si potrebbe pensare che i paradossi per il bene dei quali abbiamo inventato la gerarchia dei tipi ricomparirebbe ora. Ma questo non è il caso, in quanto, in tali paradossi, o è rilevante qualcosa che va oltre la verità o la falsità dei valori delle funzioni, o si verificano espressioni che sono senza significato, anche dopo l’introduzione dell’assioma di riducibilità.
Ad esempio, una certa dichiarazione come “Epimenide afferma ψx” non equivale a “Epimenide afferma φ! x”, anche se ψx e φ! x sono equivalenti.
Così “Io sto mentendo” resta senza significato se cerchiamo di includere tutte le proposizioni tra quelle che io posso essere in errore affermandole, e non è influenzato dall’assioma delle classi se ci limitiamo a proposizioni di ordine n. La gerarchia delle proposizioni e delle funzioni, quindi, rimane importante in soli quei soli casi in cui vi è un paradosso da evitare.
VI.
Idee primitive e proposizioni della logica simbolica.
Le idee primitive richieste in logica simbolica sembrano essere le seguenti sette:
(1) Qualsiasi funzione proposizionale di una variabile x o di più variabili x, y, z,. . . Questo sarà indicato con φx o φ (x, y, z,..)
(2) La negazione di una proposizione. Se p è la proposizione, la sua negazione sarà indicata con ~p.
(3) La disgiunzione o somma logica di due proposizioni; i. e. “questo o quello”.
Se p, q sono le due proposizioni, la loro disgiunzione sarà indicato con p V q. *
* In un precedente articolo di questa rivista, ho assunto l’implicazione come indefinibile, invece della disgiunzione. La scelta tra e due è una questione di gusti; Ora scelgo la disgiunzione, perché ci permette di diminuire il numero di proposizioni primitive.
(4) La verità di qualsiasi valore di una funzione proposizionale; ovvero, di φx dove x non è specificato.
(5) La verità di tutti i valori di una funzione proposizionale. Questa è indicata con (x). φx o (x): φx o qualunque numero maggiore di punti possano essere necessari per mettere tra parentesi la proposizione † In (x).. φx, x si chiama variabile apparente, mentre quando φx è asserito, dove x non viene specificato, x è detta variabile reale.
† L’uso dei punti segue l’uso di Peano. E ‘completamente spiegato da Whitehead, “On Cardinals numbers,” American Journal of Mathematics, vol. XXIV, e “On Mathematical Concepts of the Material World”, Phil. Trans. A., vol. CCV, pag. 472.
(6) Qualsiasi funzione predicativa di un argomento di qualsiasi tipo; questa sarà rappresentata da φ! x o φ! α o φ! R, secondo le circostanze. Una funzione predicativa di x è una funzione i cui valori sono proposizioni del tipo successivi superiori a quelli di x, se x è un particolare o una proposizione, o quello dei valori di x se x è una funzione. Essa può essere descritta come una funzione in cui le variabili apparenti, se presenti, sono tutti dello stesso tipo o di tipo inferiore ad x; ed una variabile è di tipo inferiore ad x se può presentarsi significativamente come argomento di x, o come argomento di un argomento di x, ecc.
(7) Asserzione; ovvero, l’affermazione che qualche proposizione è vera, o che qualsiasi valore di una funzione proposizionale è vero. Questo è necessario per distinguere una proposizione effettivamente asserita da una proposizione su cui si sta solo riflettendo, o da una proposizione citata come ipotesi per qualche altra cosa. Ciò sarà indicato dal segno “⊦ ” messo davanti a quanto affermato, con abbastanza punti per mettere tra parentesi ciò che si afferma. *
* Questo segno, così come l’introduzione del concetto che esprime, sono dovuti a Frege. Vedere il suo Begriffsschrift (Halle, 1879), p. 1, e Grundgesetze der Arithmetik, vol. I (Jena, 1893), p. 9.
Prima di procedere alle proposizioni primitive, abbiamo bisogno di alcune definizioni.
Nelle seguenti definizioni, nonché nelle proposizioni primitive, le lettere p, q, r sono utilizzate per indicare proposizioni.
Questa definizione stabilisce che “p ⊃ q” (che si legge “p implica q”) è il significato di “p è falsa o q è vera.” Non intendo affermare che “implica” non può avere qualsiasi altro significato, ma solo che questo significato è quello che è più conveniente dare a “implica” nella logica simbolica. In una definizione, il segno di uguaglianza e le lettere “Df” devono essere considerati come un solo simbolo, che significa congiuntamente “è definito per significare.” Il segno di uguaglianza senza le lettere “Df” ha un significato diverso, da definire a breve.
Questo definisce il prodotto logico di due proposizioni p e q, ovvero che “p e q sono entrambe vere.” La definizione di cui sopra stabilisce che questo sta a significare: “. E ‘falso che o p sia falsa o che q sia falsa” Anche in questo caso, la definizione non dà l’unico significato che può essere dato a “p e q sono entrambe vere”, ma dà il senso che è più conveniente per i nostri scopi.
Cioè, “p ≣ q”, che si legge “p è equivalente a q,” significa “p implica q e q implica p;” dove, naturalmente, ne segue che p e q sono entrambi veri o entrambi falsi.
Questo definisce che “vi è almeno un valore di x per cui φx è vero.” Noi lo definiamo nel senso “è falso che φx è sempre falso.”
Questa è la definizione di identità. Essa afferma che x e y devono essere considerati identici quando ogni funzione predicativa soddisfatta da x è soddisfatta da y. Ne consegue dall’assioma di riducibilità che se x soddisfa ψx, dove ψ è una qualsiasi funzione, predicativa o non-predicativa, allora y soddisfa ψy.
Le seguenti definizioni sono meno importanti, e vengono introdotte al solo scopo di abbreviazione.
e così via per qualsiasi numero di variabili.
Le proposizioni primitive richieste sono le seguenti. (In 2, 3, 4, 5, 6, e 10, p, q, r stanno per proposizioni.)
ovvero, “se tutti i valori di
sono veri, allora φy è vero, dove φy è un qualsiasi valore.” *
* E ‘conveniente utilizzare la notazione per indicare la funzione stessa, rispetto a questo o quel valore della funzione.
(8) Se φy è vero, dove φy è un qualsiasi valore di , allora (x) .φx è vero. Questo non può essere espresso con i nostri simboli; perché se scriviamo “φy. ⊃. (x). φx”, che significa “φy implica che tutti i valori di sono veri, dove y potrebbe avere qualsiasi valore del tipo appropriato,” che non è, in generale, il caso. Quello che intendiamo affermare è: “Se, comunque si scelga y, φy è vero, allora (x). xφ è vero, “mentre ciò che è espresso da” φy. ⊃. (x). φx “è:” Comunque y venga scelto, se φy è vero, allora (x). φx è vero “, che è un’affermazione molto diversa, e in generale una affermazione falsa.
(9) ⊦: (x) .φx. ⊃. φa, dove α è una qualsiasi costante definita.
Questo principio è davvero come tanti principi diversi quanti sono i possibili valori di a. Ovvero, esso afferma che, ad esempio, qualunque cosa sia posseduto da tutti gli individui appartiene a Socrate; inoltre che appartiene a Platone; e così via. È il principio che una regola generale può essere applicata ai casi particolari; ma al fine di darne un’applicazione, è necessario citare i casi particolari, perché altrimenti abbiamo bisogno del principio stesso per assicurarci che la regola generale che le regole generali possono essere applicate a casi particolari può essere applicato (diciamo) al caso particolare di Socrate. È così che questo principio differisce dalla (7); il nostro principio attuale fa una affermazione su Socrate, o su Platone, o qualche altra costante definita, mentre la (7) ha fatto una affermazione su di una variabile.
Il principio di cui sopra non viene mai utilizzato nella logica simbolica o matematica pura, dal momento che tutte le nostre proposizioni sono generali, e anche se non (come in “uno è un numero”) ci sembra di avere un caso assolutamente particolare, questo risulta non essere così quando esaminato da vicino. infatti, l’applicazione del principio di cui sopra è il segno distintivo della matematica applicata. Quindi, a rigor di termini, potremmo doverla omettere dalla nostra lista.
ovvero, “se ‘p o φx è sempre vero, allora o p è vera, o φx è sempre vera.”
(11) Quando f (φx) è vero per qualsiasi argomento di x possa essere, e F (φy) è vero per qualsiasi possibile argomento di y possa esserci, allora {f (φx). F (φx)} è vero per qualsiasi possibile argomento di x possa esserci.
Questo è l’assioma della “identificazione di variabili.” E’ necessario quando due distinte funzioni proposizionali sono ciascuna nota per essere sempre vere, e vogliamo dedurre che il loro prodotto logico è sempre vero. Questa deduzione è legittima solo se le due funzioni accettano argomenti dello stesso tipo, altrimenti il loro prodotto logico è privo di significato. Nell’assioma di cui sopra, x e y devono essere dello stesso tipo, perché entrambi si verifichino come argomenti di φ.
(12) Se φx. φx ⊃ ψx è vera per qualsiasi possibile x, allora ψx è vera per ogni possibile x.
Questo assioma è necessario per assicurarci che l’intervallo di validità di ψx, nel caso supposto, è lo stesso di quello di φx. φx ⊃ ψ x. ⊃. ψx; entrambi sono infatti dello stesso di φx. Sappiamo che, nel caso supposto, che ψx è vero ogni volta che φx. φx ⊃ ψ x e φx. φx ⊃ ψx. ⊃. ψx hanno entrambi significato, ma non sappiamo, senza un assioma, che ψx è vero ogniqualvolta che ψx ha significato. Da qui la necessità di un assioma.
Gli assiomi (11) e (12) sono necessari, ad esempio, a dimostrare
Dalla (7) e (11),
donde da (12),
donde il risultato segue dalla (8) e (10).
Questo è l’assioma di riducibilità. Esso afferma che, data un qualsiasi funzione esiste una funzione predicativa
tale che f! x è sempre equivalente a φx.
Si noti che, dal momento che una proposizione che inizia con “(∃f)” è, per definizione, la negazione di una proposizione che inizia con “(f),” l’assioma di cui sopra comporta la possibilità di considerare “tutte le funzioni predicative di x.” Se φx è una qualsiasi funzione di x, non possiamo costruire proposizioni che iniziano con “(φ)” o “(∃φ),” dato che non possiamo prendere in considerazione “tutte le funzioni,” ma solo “qualsiasi funzione” o “tutte le funzioni predicative.”
Questo è l’assioma di riducibilità per le funzioni doppie.
Nelle proposizioni sopra riportate, le nostre x e y possono essere di di qualsiasi tipo quale che sia. L’unico modo in cui la teoria dei tipi è pertinente è quello solo (11) che ci permette di identificare variabili reali che si verificano in vari contenuti quando si dimostri essere dello stesso tipo per entrambi che si presentano come argomenti per la stessa funzione, e che, in (7) e (9), y e a devono essere rispettivamente del tipo appropriato per gli argomenti di
Così, per esempio, supponiamo di avere una proposizione della forma che è una funzione di secondo ordine di x. Allora per la (7),
dove è una funzione di primo ordine. Ma non tratterà come se fosse una funzione del primo ordine di x, e non assumerà questa funzione come un possibile valore di di cui sopra. Si tratta di tali confusioni di tipi che danno origine al paradosso del mentitore.
Inoltre, prendiamo in considerazione le classi che non sono membri di se stesse. E ‘chiaro che, dal momento che abbiamo identificato le classi con le funzioni, * nessuna classe può essere significativamente affermata di essere o di non essere un membro di se stessa; perché i membri di una classe sono argomenti di essa, e gli argomenti di una funzione sono sempre di tipo inferiore rispetto alla funzione. E se ci chiediamo: “Ma che diremmo sulla classe di tutte le classi?
Non è questa una classe, e quindi un membro di se stessa? “, La risposta è duplice. In primo luogo, se” la classe di tutte le classi “significa” la classe di tutte le classi di qualsiasi tipo, ” pertanto non esiste tale nozione. In secondo luogo, se “la classe di tutte le classi” significa “la classe di tutte le classi di tipo t”, allora questa è una classe di tipo successivo rispetto a t, e non è quindi ancora una volta un membro di se stessa.
* Questa identificazione è soggetta ad una modifica da spiegare a breve.
Così, sebbene le proposizioni primitive di cui sopra si applichino indistintamente a tutti i tipi, non ci permettono di suscitare contraddizioni. Pertanto, nel corso di ogni deduzione non è mai necessario considerare il tipo assoluto di una variabile; è solo necessario vedere che le diverse variabili che si verificano in una proposizione sono dei corretti tipi relativi. Ciò esclude tali funzioni come quella da cui è stata ottenuta la nostra quarta contraddizione, e cioè: “Il rapporto R resta valido tra R e S.” Perché una relazione tra R e S è necessariamente di tipo superiore a entrambe esse, così che la funzione proposta è senza significato.
VII.
Teoria elementare delle Classi e delle Relazioni.
Le proposizioni in cui si presenta una funzione φ possono dipendere, per il loro valore di verità, dalla particolare funzione φ, oppure possono dipendere solo dalla estensione di φ, ovvero, dagli argomenti che soddisfano φ. Una funzione di quest’ultimo tipo si chiamerà estensionale. Così, ad esempio, “Credo che tutti gli uomini sono mortali” non può essere equivalente a “Io credo che tutti i bipedi implumi sono mortali”, anche se gli uomini hanno lo stesso ambito estensionale con i bipedi implumi; perché non posso sapere che hanno lo stesso ambito estensionale. Ma “tutti gli uomini sono mortali” deve essere equivalente a “tutti i bipedi implumi sono mortali” se gli uomini hanno lo stesso ambito estensionale con bipedi implumi. Così “tutti gli uomini sono mortali” è una funzione estensionale della funzione “x è un uomo”, mentre “Credo che tutti gli uomini sono mortali”, è una funzione che non è estensionale; noi le chiameremo funzioni intensionali quando non sono estensionali. Le funzioni di funzioni delle quali la matematica si occupa sono tutte estensionali.
La scrittura di una funzione f estensionale di una funzione è è
Da qualsiasi funzione f di una funzione possiamo ricavare una funzione estensionale associata come segue. Posto
La funzione
è in realtà una funzione di quantunque non la stessa funzione supponendo che quest’ultima abbia significato. Ma è utile per trattare tecnicamente come se avesse un argomento che noi chiamiamo “la classe definita da ψ.” Abbiamo
da cui , applicando agli oggetti fittizi e la definizione di identità di cui sopra, troviamo
Questa, con la sua opposta (che può anche essere dimostrata), è la proprietà distintiva delle classi. Quindi siamo giustificati nel trattare
come la classe definita da φ. Allo stesso modo poniamo
Poche parole sono necessarie qui per la distinzione tra e
Noi adotteremo la seguente convenzione: Quando una funzione (al contrario dei suoi valori) è rappresentata in una forma che coinvolge e , o qualsiasi altre due lettere dell’alfabeto, il valore di questa funzione per gli argomenti a e b deve essere trovato sostituendo a ad e b a ; ovvero, l’argomento accennato per primo è da sostituire con la lettera che viene prima nell’alfabeto, e l’argomento citato per secondo con la lettera successiva. Questo distingue sufficientemente tra ad esempio:
Poniamo
da cui
Inoltre, per l’assioma di riducibilità, abbiamo
da cui
Questo vale qualunque sia x. Supponiamo ora che vogliamo considerare
Abbiamo, da quanto sopra,
da cui
dove x è scritto per ogni espressione della forma
Abbiamo posto
Qui cls ha un significato che dipende dal tipo di variabile apparente φ.
Così, ad esempio, la proposizione “cls ε cls”, che è una conseguenza della definizione di cui sopra, richiede che “cls” abbia un significato diverso nei due luoghi in cui si verifica. Il simbolo “cls” può essere utilizzato solo dove non è necessario conoscere il tipo; esso ha un’ambiguità che si adatta alle circostanze. Se si introduce come un indefinibile la funzione “Indiv! x”, che significa “x è un particolare,” possiamo porre
Allora Kl è un simbolo non ambiguo che significa “classi di particolari.”
Useremo le lettere greche minuscole (tranne ε, φ, ψ, Χ, θ) per rappresentare le classi di qualsiasi tipo; ovvero, per rappresentare i simboli della forma
La teoria delle classi va avanti, da questo punto in poi, quasi come nel sistema di Peano;
sostituisce
Inoltre ho posto
dove Λ, come con Peano, è la classe nulla. I simboli ∃, Λ, V, come cls e ε, sono ambigue, e acquistano un significato preciso solo quando il tipo in questione è altrimenti indicato.
Trattiamo le relazioni esattamente nello stesso modo, ponendo
(essendo l’ordine determinato dall’ordine alfabetico di x e y e l’ordine tipografico di a e b); da cui
donde, per l’assioma di riducibilità,
Usiamo lettere maiuscole latine come abbreviazioni per certi simboli come
e troviamo
Poniamo
e troviamo che ogni cosa dimostrata per le classi ha il suo analogo per le relazioni duali.
Seguendo Peano, abbiamo posto
che definisce il prodotto, o la parte comune, di due classi;
che definisce la somma di due classi; e
che definisce la negazione di una classe. Allo stesso modo per le relazioni abbiamo posto
VIII.
Le Funzioni Descrittive.
Le funzioni finora considerate sono funzioni proposizionali, con l’eccezione di alcune particolari funzioni quali
Ma le funzioni ordinarie della matematica, come la x2, sin x, log x, non sono proposizionali.
Funzioni di questo tipo significano sempre “il termine che ha tale-e-talaltra relazione con x.” Per questo motivo esse possono essere chiamate funzioni descrittive, perché descrivono un certo termine attraverso la sua relazione con il loro argomento. Così “sin π / 2” descrive il numero 1; anche proposizioni in cui il sin π / 2 si verifica non sono le stesse se venissero sostituite dall’1. Questo appare, ad esempio, dalla proposizione “sin π / 2 = 1, “che trasmette informazioni importanti, mentre” 1 = 1 “è banale. Le funzioni descrittive non hanno alcun significato di per sé, ma solo come componenti di proposizioni; e questo vale in generale per le frasi del tipo” il termine che ha la tale e talaltra proprietà.” Quindi nel trattare con tali frasi, dobbiamo definire ogni proposizione in cui si manifestano, non le frasi stesse. *
Siamo così condotti alla seguente definizione, in cui
deve essere letto”il termine x che soddisfa φx.”
* Vedere il citato articolo ‘On Denoting “, dove le ragioni di questo punto di vista sono dati particolareggiatamente.
Questa definizione afferma che “il termine che soddisfa φ soddisfa ψ” deve significare: “C’è un termine b tale che φx è vero se e solo se x è b, e ψb è vero” Così tutte le proposizioni su “il così e così” sarà falso se non ci sono dei così-e-così o più così-e-così.
La definizione generale di una funzione descrittiva è
cioè, “R’y” sta a significare “il termine che ha la relazione R con y.” Se ci sono diversi termini o nessun termine aventi la relazione R con y, tutte le proposizioni circa R’y saranno false. Abbiamo posto
Qui può essere letto “c’è un termine come la x che soddisfa φx,” o “la x che soddisfa φx esiste.” Abbiamo
La virgola invertita in R’y può essere letta come di. Quindi se R è il rapporto di padre in figlio, “R’y” è “il padre di y.” Se R è il rapporto del figlio con il padre, ‘tutte le proposizioni circa R’y saranno false a meno y ha un figlio e non di più di un figlio.
Da quanto sopra risulta che funzioni descrittivi sono ottenute da relazioni. Le relazioni ora da essere definite sono soprattutto importanti a causa delle funzioni descrittive a cui danno origine.
Qui Cnv è l’abbreviazione di “opposto”. Essa è la relazione di una relazione con la sua opposta; ad esempio, di maggiore con minore, di parentela con l’essere figlio, di precedere con seguire, ecc
Abbiamo
Per una notazione più breve, spesso più utile, abbiamo posto
Vogliamo poi una notazione per la classe di termini che hanno la relazione R con y.
A questo scopo, abbiamo posto
da dove
Allo stesso modo abbiamo posto
da dove
Vogliamo successivamente il dominio di R (cioè, la classe di termini che hanno la relazione R con qualcosa), il dominio inverso di R (cioè, la classe dei termini con cui qualcosa ha la relazione R), e il campo di R, che è la somma del dominio e il dominio inverso. A tal fine definiamo le relazioni di dominio, dominio inverso, e il campo, con R. Le definizioni sono:
Si noti che la terza di queste definizioni è significativa solo quando R è quello che potremmo chiamare una relazione omogenea; ovvero, in cui, se xRy sussiste, x ed y sono dello stesso tipo. Perché nel caso contrario, comunque scegliamo x e y, sia xRy o yRx saranno prive di significato. Questa osservazione è importante in relazione alla contraddizione di Burali-Forti.
Abbiamo, in virtù delle definizioni di cui sopra,
l’ultima delle quali è significativa solo quando R è omogenea. “D’R” si legge “il dominio di R;” si legge “il dominio inverso di R” e “C’R” si legge “il campo di R.” La lettera C è scelta come iniziale della parola “campus”.
Vogliamo successivamente una notazione per la relazione, per una classe α contenuta nel dominio di R, della classe di termini con cui qualche membro α ha la relazione R, e anche per la relazione, con una classe β contenuta nel dominio inverso di R, della classe di termini che hanno la relazione R con qualche membro di β. Per il secondo di questi abbiamo posto
Così che
Quindi se R è la relazione tra padre e figlio, e β è la classe degli Etoniani, Rε‘β sarà la classe “padri degli Etoniani”; se R è la relazione “minore di”, e β è la classe delle frazioni proprie nella forma 1 – 2-n per valori interi di n, Rε‘β sarà la classe di frazioni minori di alcune frazioni della forma 1 – 2-n; ovvero., Rε‘β sarà la classe delle frazioni proprie. L’altra relazione di cui sopra è
Abbiamo posto, come notazione alternativa spesso più conveniente,
Il prodotto relativo di due relazioni R, S è la relazione che si verifica fra x e z ogni volta che esiste un termine y tale che xRy e yRz entrambi si verificano.
Il prodotto relativo è indicato con R | S. Così
Abbiamo posto anche
Il prodotto e la somma di una classe di classi sono spesso necessari. Sono definiti come segue:
Analogamente per le relazioni poniamo
Abbiamo bisogno di una notazione per la classe il cui unico membro è x. Peano usa ιx, quindi useremo ι’x. Peano ha mostrato (quello che anche Frege aveva sottolineato) che questa classe non può essere identificata con x. Con il punto di vista abituale sulle classi, la necessità di una tale distinzione rimane un mistero; ma dal punto di vista di cui sopra, diventa evidente.
Abbiamo posto
da dove
e
ovvero, se α è una classe che ha un solo membro, allora
è questo unico membro. *
Per la classe di classi contenute in una data classe, abbiamo posto
Possiamo ora procedere alla considerazione dei numeri cardinali e ordinali, e di come essi sono influenzati dalla dottrina di tipi.
* Così è quello che Peano chiama
IX.
Numeri cardinali.
Il numero cardinale di una classe α è definito come la classe di tutte le classi simili ad α, due classi essendo simile quando vi è una relazione biunivoca tra loro.
La classe delle relazioni biunivoche è indicata con | → | e definito come segue:
Similmente è indicato con Sim; la sua definizione è
Allora è, per definizione, il numero cardinale di α; indicheremo questo con quindi poniamo
da cui
Indicheremo la classe dei cardinali con NC; così
0 è definito come la classe il cui unico membro è la classe nulla, Λ, in modo che
La definizione di 1 è
E ‘facile dimostrare che 0 e 1 sono cardinali in accordo con la definizione.
Va osservato, tuttavia, che 0 e 1 e tutti gli altri cardinali, secondo le definizioni di cui sopra, sono simboli ambigui, come cls, e hanno tanti significati quanti sono i tipi. Per cominciare con 0: il significato di 0 dipende da quello di Λ, e il significato di Λ è differente a seconda del tipo di cui è la classe nulla. Così ci sono tanti 0 quanti sono i tipi; e lo stesso vale per tutti gli altri cardinali. Tuttavia, se due classi α, β sono di diversi tipi, si può parlare di esse come aventi lo stesso cardinale, o di una come avente un cardinale maggiore rispetto all’atra, perché una relazione biunivoca può sussistere tra i membri di α e i membri di β, anche quando α e β sono di diversi tipi. Ad esempio, supponiamo β essere ι “α; ovvero., la classe i cui membri sono le classi che consistono dei singoli membri di α. Allora ι “α è di tipo superiore α, ma simile a α, essendo correlata con α dalla relazione biunivoca ι.
La gerarchia dei tipi ha importanti risultati in materia di addizione.
Supponiamo di avere una classe di α termini e una classe di β termini, dove α e β sono cardinali; può essere abbastanza impossibile sommarli tra loro per ottenere una classe di termini α e β, poiché, se le classi non sono dello stesso tipo, la loro somma logica è senza senso. Se solo sono interessate un numero finito di classi, possiamo evitare le conseguenze pratiche di questo, per il fatto che si possono sempre applicare operazioni di una classe che aumenta il suo tipo alla misura richiesta senza alterarne il numero cardinale. Ad esempio, data una qualsiasi classe α, la classe ι”α ha lo stesso numero cardinale, ma è di tipo immediatamente superiore ad α. Quindi, dato un qualsiasi numero finito di classi di tipi diversi, siamo in grado di aumentarle tutte al tipo che è quello che potremmo chiamare il minimo comune multiplo di tutti i tipi in questione; e si può dimostrare che questo può essere fatto in modo tale che le classi risultanti non abbiano nessun membro in comune. Possiamo poi formare la somma logica di tutte le classi così ottenute, e il suo numero cardinale sarà la somma aritmetica dei numeri cardinali delle classi originali. Ma dove abbiamo una serie infinita di classi di tipi ascendente, questo metodo non può essere applicato. Per questo motivo, non possiamo ora dimostrare che esistano classi infinite. Supponiamo che ci fossero del tutto solo n particolari nell’universo, dove n è finito. Ci sarebbero allora 2n classi di particolari, e 22n classi di classi di particolari, e così via. Così il numero cardinale dei termini in ogni tipo sarebbe finito e sebbene questi numeri crescano oltre ogni numero finito assegnato, non ci sarebbe modo di sommarli in modo da ottenere un numero infinito. Quindi abbiamo bisogno di un assioma, così mi sembrerebbe, nel senso che nessuna classe finita di particolari contiene tutti i particolari; ma se uno sceglie di assumere che il numero totale di particolari nell’universo è (diciamo) 10.367, non ci sembra un modo a priori di confutare la sua opinione.
Dalla modalità di ragionamento di cui sopra , è chiaro che la dottrina dei tipi evita tutte le difficoltà per il più grande numero cardinale. Esiste un maggiore cardinale in ogni tipo, vale a dire il numero cardinale dell’insieme del tipo; ma questo viene sempre superato dal numero cardinale del tipo successivo, poiché, se α è il numero cardinale di un tipo, quello del tipo successivo è 2α, che, come Cantor ha dimostrato, è sempre maggiore di α. Poiché non c’è modo di sommare tipi differenti, non si può parlare di “il numero cardinale di tutti gli oggetti, di qualsiasi tipo”, e quindi non esiste affatto un più grande numero cardinale.
Se si ammette che nessuna classe finita di particolari contiene tutti i particolari, ne consegue che ci sono classi di particolari aventi qualsiasi numero finito. Quindi esistono tutti i cardinali finiti come singoli-cardinali; cioè, come numeri cardinali di classi di particolari. Ne consegue che esiste una classe di ℵ0 cardinali, vale a dire, la classe dei cardinali finiti. Quindi ℵ0 esiste come il cardinale di una classe di classi di classi di particolari. Formando tutte le classi dei cardinali finiti, troviamo che 2ℵ0 esiste come il cardinale di una classe di classi di classi di classi di particolari; e così possiamo procedere all’infinito. L’esistenza di ℵn per ogni valore finito di n può essere dimostrata; ma questo richiede la considerazione degli ordinali.
Se, oltre ad assumere che nessuna classe finita contiene tutti i particolari, assumiamo l’assioma moltiplicativo (cioè, l’assioma che, dato un insieme di classi mutuamente esclusive, nessuna delle quali è nulla, vi è almeno una classe composta da un membro per ogni classe nell’insieme delle classi), allora possiamo dimostrare che esiste una classe di particolari che contengono ℵ0 membri, in modo che ℵ0 esisterà come singolo-cardinale.
Questo riduce un po’ il tipo verso cui dobbiamo andare al fine di dimostrare il teorema di esistenza per ogni cardinale, ma non ci fornisce alcun teorema di esistenza che non può essere ottenuto in altro modo, prima o poi.
Molti teoremi elementari riguardanti i numeri cardinali richiedono l’assioma moltiplicativo. * E ‘da osservare che questo assioma è equivalente a quello di Zermelo, † e quindi al presupposto che ogni classe può essere ben ordinata. ‡ Queste ipotesi equivalenti sono, a quanto pare, tutte incapaci di prova, anche se l’assioma moltiplicativo, almeno, appare evidente in sé. In assenza di prove, sembra meglio non assumere l’assioma moltiplicativo, ma porlo come un’ipotesi in ogni occasione in cui viene utilizzato.
* Cf. Parte III di un documento dall’autore, “On some Difficulties in the Theory of Transfinite Numbers and Order Types,”, Proc. London Math. Soc. Ser. II, vol. IV, parte I.
† Cf. loc. cit. per una affermazione dell’assioma di Zermelo, e per la prova che questo assioma implica l’assioma moltiplicativo. La deduzione opposta risulta come segue: Poniamo Prod ‘k per la classe moltiplicativo di k, consideriamo
e assumiamo
Allora R è una correlazione di Zermelo. Quindi se Prod’ Z” cl’α non è nullo, almeno una correlazione di Zermelo con α esiste.
‡ Vedere Zermelo, “Beweis, dass jede Menge wohlgeordnet werden kann.” Math. Annalen, vol. LIX, pp. 514-516.
X.
Numeri ordinali.
Un numero ordinale è una classe di una serie ordinalmente simile ben ordinata, cioè, di relazioni che generano tale serie. La similitudine ordinale o somiglianza è definita come segue:
dove “Smor” è l’abbreviazione di “ordinalmente simile.”
La classe di relazioni seriali, che chiameremo “Ser” è definita come segue:
Cioè, leggendo P come “precede”, una relazione è seriale, se (1) nessun termine precede sé stesso, (2) un predecessore di un predecessore è un predecessore, (3) se x è qualsiasi termine nel campo della della relazione, allora i predecessori di x insieme a x insieme con i successori x costituiscono l’intero campo della relazione.
Le relazioni seriali ben ordinate, che chiameremo Ω, sono definite come segue:
ovvero, P genera una serie ben ordinata se P è seriale, e qualsiasi classe α nel campo della P e non nulla ha un primo termine. (Si noti che sono i termini che vengono dopo un certo termine di α).
Se indichiamo con N0’P il numero ordinale di una relazione ben ordinata P, e con NO la classe dei numeri ordinali, avremo
Dalla definizione di N0 abbiamo
Se ora esaminiamo le nostre definizioni dal punto di vista della loro connessione con la teoria dei tipi, vediamo, per cominciare, che le definizioni di “Ser” e Ω coinvolgono i campi delle relazioni seriali. Ora il campo è significativo solo quando la relazione è omogenea; quindi le relazioni che non sono omogenee non generano serie. Ad esempio, la relazione ι potrebbe essere intesa generare serie di numero ordinale ω, come
e potremmo tentare di dimostrare in questo modo l’esistenza di ω e ℵ0. Ma x e ι’x sono di diversi tipi, e quindi non esiste tale serie secondo la definizione.
Il numero ordinale di una serie di particolari è, per la definizione di cui sopra di N0, una classe di relazioni di particolari. È quindi di un tipo diverso da ogni particolare, e non può formare parte di qualsiasi serie in cui si presentano particolari.
Inoltre, supponiamo che tutti gli ordinali finiti esistano come singoli ordinali; ovvero, come gli ordinali di serie di particolari. Allora gli ordinali finiti stessi formano una serie il cui numero ordinale è ω; quindi ω esiste come ordinale-ordinale, ovvero, come ordinale di una serie di numeri ordinali. Ma il tipo di un ordinale ordinale è quello di classi di relazioni di classi di relazioni di particolari. Così l’esistenza di ω è stata dimostrata in un tipo superiore a quello dei ordinali finiti. Inoltre, il numero cardinale dei numeri ordinali della serie ben ordinata che può essere costituita di ordinali finiti è ℵ1; quindi ℵ1, esiste nel tipo di classi di classi di classi di relazioni di classi di relazioni di particolari. Anche i numeri ordinali della serie ordinata composta da ordinali finiti possono essere disposti in ordine di grandezza, e il risultato è una serie ben ordinata il cui numero ordinale è ω1.
Quindi ω1 esiste come un ordinale ordinale ordinale. Questo processo può essere ripetuto un qualsiasi numero finito di volte, e quindi siamo in grado di dimostrare l’esistenza, in tipi appropriati, di ℵn e ωn per ogni valore finito di n.
Ma il suddetto processo di generazione non porta più a qualsiasi insieme di tutti gli ordinali, perché, se prendiamo tutti gli ordinali di qualsiasi dato tipo, ci sono sempre ordinali nei tipi superiori; e non siamo in grado di sommare un insieme di ordinali il cui il tipo si alza sopra di ogni limite finito. Così tutti gli ordinali in qualsiasi tipo possono essere organizzati per ordine di grandezza in una serie ben ordinata, che ha un numero ordinale di tipo superiore a quello degli ordinali che compongono la serie.
Nel nuovo tipo, questo nuovo ordinale non è il maggiore. In realtà, non c’è più l’ordinale maggiore in qualunque tipo, ma in ogni tipo tutti gli ordinali sono minori di alcuni ordinali di tipo superiore. E’ impossibile completare la serie dei numeri ordinali, in quanto sale a tipi al di sopra di ogni limite finito assegnabile; così anche se ciascun segmento della serie di ordinali è ben ordinato, non possiamo dire che l’intera serie è ben ordinata, perché “l’intera serie” è una fandonia. Quindi la contraddizione Burali-Forti scompare.
Dalle ultime due sezioni sembra che, se è consentito che il numero di particolari non sia finito, l’esistenza di tutti i numeri cardinali e ordinali di Cantor può essere dimostrata, all’infuori di ℵω e ωω. (E del tutto possibile che l’esistenza di questi possa anche essere dimostrabile.) L’esistenza di tutti i cardinali e ordinali finiti può essere provata senza assumere l’esistenza di qualsiasi cosa.
Perché se il numero cardinale di termini in qualsiasi tipo è n, quello dei termini del tipo successivo è 2n. Quindi se non ci sono particolari, ci sarà una classe (cioè, la classe nulla), due classi di classi (vale a dire, che non contengono nessuna classe e che contiene la classe nulla), quattro classi di classi di classi, e in generale 2n-1 classi di ordine n-esimo. Ma non possiamo sommare insieme termini di tipi diversi, e quindi non possiamo in questo modo dimostrare l’esistenza di qualsiasi classe infinita.
Possiamo ora riassumere tutta la nostra discussione. Dopo aver ricordato alcuni dei paradossi della logica, abbiamo trovato che tutti questi nascono dal fatto che un’espressione che si riferisce a tutti di un qualche insieme può sembrare che essa stessa indichi un elemento dell’insieme; come, per esempio, “tutte le proposizioni sono o vere o false” sembra essere di per sé una proposizione. Abbiamo deciso che, dove questo sembra accadere, stiamo trattando di una falsa totalità, e che in realtà nulla di tutto ciò può essere detto in modo sensato sul tutto del presunto insieme. Al fine di dare attuazione alla presente decisione, abbiamo spiegato una dottrina dei tipi delle variabili, partendo dal principio che ogni espressione che si riferisce a tutto di un certo tipo deve, se denota qualcosa, denotare qualcosa di un tipo superiore di quello a cui il tutto cui si riferisce.
Dove un tutto di qualche tipo viene trattato, vi è una variabile apparente appartenente a tale tipo. Pertanto qualsiasi espressione contenente una variabile apparente è di tipo superiore a questa variabile. Questo è il principio fondamentale della dottrina dei tipi.
Un cambiamento nel modo in cui i tipi sono costruiti, qualora fosse necessario, lascerebbe la soluzione delle contraddizioni intatta fino a che questo principio fondamentale sia rispettato. Il metodo di costruire i tipi spiegato sopra è stato mostrato per premetterci di porre tutte le definizioni fondamentali della matematica, e allo stesso tempo di evitare ogni contraddizione conosciuta. Ed è emerso che, in pratica, la dottrina dei tipi non è mai rilevante se non sono interessati i teoremi di esistenza, o dove le applicazioni devono essere fatte per qualche caso particolare.
La teoria dei tipi solleva una serie di difficili questioni filosofiche riguardanti la sua interpretazione. Queste domande sono, tuttavia, in sostanza separabili dallo sviluppo della teoria matematica, e, come tutte le questioni filosofiche, introducono elementi di incertezza che non appartengono alla teoria stessa. E’ sembrato meglio, dunque, affermare la teoria senza riferimento a questioni filosofiche, lasciando che si affrontino queste in modo indipendente.