L’AI non è un’intelligenza

16 Lug

L’attuale intelligenza artificiale è basata su sistemi e presupposti errati.

In sostanza si tratta del prosieguo del metodo di Turing mediante un programma che, grazie alla disponibilità di hardware adeguato, permette di costruire qualcosa di simile a quello che farebbe una persona. Questo si ottiene in base ad un programma aperto che permette di accedere ad una fonte quasi inesauribile di dati messi a disposizione della memoria della macchina.
Naturalmente le risposte della AI dipendono dalla banca dati a cui ha avuto la possibilità di accedere, non c’è gerarchia nelle informazioni, non c’è distinzione tra informazioni vere e informazioni false e non c’è nessuna possibilità di controllo etico del risultato fornito.

Il problema è basilare perché si è pensato, erroneamente, che per fare intelligenza artificiale occorresse avere a disposizione una banca dati e che il risultato sarebbe stato tanto più efficace quanto più larga fosse stata tale banca dati.

Questo, tuttavia, non somiglia nemmeno lontanamente all’intelligenza naturale, come può riconoscere ognuno solo facendo poche valutazioni logiche, ma è pericoloso non solo per i motivi ovvi di danno che può produrre, ma soprattutto perché, se utilizzata come mezzo per fare qualsiasi cosa, costringe a non avere innovazione nei metodi e nella sostanza in quanto è solo un sistema che guarda al passato recente e remoto.

Come detto, non essendoci nessuna gerarchia tra le informazioni del data base, si può mescolare tranquillamente il vero con il falso, fatti veramente accaduti e leggende con risultati che probabilmente verranno scartati nelle risposte se c’è un minimo controllo di coerenza nell’output.

In realtà l’intelligenza naturale per dare delle risposte si serve solo delle informazioni di cui dispone e che riguardano il tema di cui si tratta.

Facciamo un esempio: si debba prendere una decisione se scommettere su una corsa di cani e quanto scommettere.

Se non conosciamo i cani che concorrono alla corsa inizialmente tutti hanno la stessa probabilità di vincere e questa è la sola informazione di cui può disporre il nostro “data base” sull’argomento se siamo persone normodotate intellettualmente. Cioè se i cani sono dodici ogni cane ha una ragione di scommessa 1 a favore e 11 contro. Quanto scommettere dipende dalla nostra valutazione soggettiva del valore del denaro di cui disponiamo. Questo non è un dato che possiede l’AI perché quest’ultima è, in quanto non intelligente, generalista nei suoi risultati.

Se siamo intenzionati a scommettere andremo a guardare le quotazioni dei bookmaker e da questo sapremo che chi si occupa di corse ha fatto una valutazione in base ai precedenti di tutti i cani in gara. Quindi potremo considerare per ogni concorrente i casi a favore e quelli contro con maggior raffinatezza e quindi essere indotti a scommettere di più o di meno su ogni cane a seconda dei risultati attesi.

La spesa sostenibile in scommessa non dipende solo dalla “curva individuale dell’utilità del denaro”, ma anche da fatti esterni come i rimbrotti della moglie se si perde, lo sfottò dei colleghi sul posto di lavoro o degli amici al bar. Ci può essere una volontà di evitare di far perdere denaro alla famiglia causando ristrettezze.

Quindi c’è in questa valutazione una costrizione di tipo “etico” perlomeno nelle forme più semplificate e comuni.

In ultima analisi per prendere una decisione, in questo caso occorrono pochissime informazioni a noi note e da acquisire all’esterno. Sarebbe assurdo che per scommettere ai dadi una persona prima si leggesse tutta la bibbia e la Gerusalemme Liberata di Torquato Tasso.

Invece l’AI è abile al lavoro quando si è riempita di dati, anche inutili per la singola richiesta particolare, e può farci fare cose che sono incoerenti con il nostro modo di pensare in quanto non può tenere conto del “carattere” soggettivo di chi la interroga per fare qualsiasi cosa.

Quindi se pensata per fare più alla svelta quello che già fanno i normali computer evitandoci di fare cose ripetitive, può servire, ma per fare innovazione, per prendere decisioni è talmente pericolosa da essere paragonabile alla scoperta della fissione dell’atomo che venne subito utilizzata per sterminare gli abitanti di due città giapponesi.

Andreatta, padre della stangata

16 Apr

Ripropongo un articolo del numero di Settembre 1982 di Alfabeta sul divorzio tra Bankitalia e Tesoro di un, allora, giovane economista, il prof. Augusto Graziani

(l’immagine è tratta dal sito di Keynesblog)

Andreatta, padre della stangata

Augusto Graziani

Chi volesse tentare una valutazione della politica economica del ministro del Tesoro Andreatta, sarebbe tentato di definirla:astuta sotto il  profilo tecnico, rischiosa dal punto di i vista economico, rovinosa nel suo contenuto politico. Da giovane, Andreatta scrisse un brillante saggio di teoria e tecnica monetaria. Lo intitolò Il governo della liquidità e lo dedicò a Guido Carli, allora Principe della Banca d’Italia, che lo lesse e se ne compiacque. Oggi, al timone dell’economia italiana, Andreatta comprova la sua ca-pacità di governare la liquidità. Ma il governare il tessuto produttivo e la struttura economica e sociale del paese si rivela cosa assai più complessa e insidiosa, ed i rischi di produrre guasti irreversibili sono assai maggiori.

Negli anni più recenti, il processo di ristrutturazione dell’industria italiana, iniziato ormai più di dieci anni or sono, ha compiuto un altro balzo in avanti. Un primo aspetto di questa trasformazione è ormai così noto che è sufficiente ricordarlo nei suoi termini più sintetici. La riduzione progressiva del peso della grande industria, il decentramento produttivo, lo sviluppo di medie e piccole imprese, il dilagare del lavoro indipendente, del lavoro a domicilio e del lavoro nero, hanno consentito al capitale industriale italiano non soltanto una riduzione sostanziale del costo del lavoro, ma anche l’acquisizione di un controllo del processo produttivo che l’avanzata sindacale di dieci anni or sono aveva seriamente ridotto.

È questo un processo certamente non ancora giunto al suo termine (nessun processo di trasformazione possiede un suo preciso termine finale): ma esso ha avuto modo di esplicarsi per un periodo sufficientemente lungo per poterne scorgere con chiarezza linee e contenuto. L’industria italiana si ritrova oggi con una struttura modificata nelle dimensioni tecniche (assai meno grandi impianti e molte unità minori in più), diversamente distribuita nel territorio (mai dimenticata l’antica concentrazione nel triangolo industriale, e intensamente industrializzate le regioni nordorientali e centrali), profondamente alterate le tecnologie (automazione spinta nei grandi impianti, uso sempre più diffuso dell’elettronica nelle imprese minori).

Tutto questo, come è stato tante volte messo in risalto, può essere interpretato come una grande manovra antisindacale, tendente a disperdere la forza lavoro, rafforzando il controllo padronale.

Vi è tuttavia un secondo aspetto della ristrutturazione produttiva, le cui linee sono emerse con chiarezza soltanto in tempi più recenti ed hanno quindi ricevuto finora minore attenzione. La trasformazione strutturale dell’industria italiana è stata accompagnata da una selezione progressiva di settori e mercati che l’ha condotta a concentrare le esportazioni verso i mercati europei

Questa vocazione europeistica è una tradizione antica della politica italiana, giustificata di volta in volta con argomentazioni di carattere politico, culturale, storico, sentimentale. Le sue radici risiedono probabilmente nell’inserimento internazionale del paese e sono frutto di scelte in parte libere in parte vincolate.

A stento, e con un certo sforzo, dopo la crisi petrolifera, le imprese italiane hanno cominciato a farsi strada nei mercati dei paesi Opec. Ma tuttora, la quota delle esportazioni italiane dirette ai mercati europei è una quota dominante, mentre le esportazioni verso l’area del dollaro conservano un peso sostanzialmente modesto. Ancora oggi, più della metà delle esportazioni italiane (il 53 per cento) è rivolta a destinazioni europee, mentre la quota diretta agli Stati Uniti è inferiore al 7 per cento e tende a contrarsi (dieci anni or sono toccava quasi il l0 per cento).

Che tutto questo sia stato in vari modi favorito e pilotato dalle autorità economiche è cosa che sarebbe difficile negare. Basti ricordare che, fra il 1973 ed il 1979, allorché venne praticato dai paesi occidentali un sistema di pagamenti internazionali a cambi flessibili, le autorità italiane manovrarono il corso della lira in modo da provocare una graduale,svalutazione nei confronti del marco tedesco, cercando al tempo stesso di tenere stabile o addirittura di rivalutare, la lira nei confronti del dollaro. Questa politica di cambi differenziati venne allora considerata di grande saggezza, in quanto, traendo vantaggio da un andamento dei cambi favorevole, le autorità riuscivano ad evitare che le importazioni, provenienti per lo più dall’area del dollaro, crescessero di prezzo, rendendo al tempo stesso le esportazioni italiane più competitive nei mercati europei.

Ma se sotto il profilo immediato, i risultati erano indubbiamente favorevoli, sotto il profilo strutturale la manovra del cambio favoriva ulteriormente la specializzazione delle esportazioni italiane verso l’area europea, e scoraggiava gli esportatori italiani nei confronti dell’area del dollaro.

La concentrazione delle esportazioni italiane verso l’area europea ha prodotto conseguenze negative che non possono essere trascurate. La conseguenza maggiore, e quella che merita più seria attenzione, è che l’industria italiana si è trovata a competere con strutture industriali tecnologicamente più avanzate, e quindi su mercati nei quali i prodotti italiani potevano affermarsi soltanto in virtù di prezzi più bassi, industrie d’avanguardia sotto il profilo tecnologico, come quella germanica, riescono a collocare i propri prodotti in ragione della novità e della tecnologia in essi incorporata.

Industrie come quella italiana, allorché si trovano ad agire in mercati come quello europeo dominati da strutture industriali più avanzate, devono fare affidamento sul basso costo del prodotto.

Infatti, nell’ultimo decennio la quota di prodotti innovativi collocati dall’Italia nei mercati della Germania Federale è caduta dal 9 per cento al 6 per cento mentre è cresciuta dal 22 per cento al 24 per cento la quota di esportazioni tradizionali.

Ecco dunque che, riaffermando l’orientamento delle esportazioni italiane verso i mercati europei, si è prodotta un’esigenza precisa, quella di puntare non già sull’avanzamento tecnologico bensì sulla continua riduzione dei costi.

Riduzioni di costo possono essere ottenute sia aumentando i prezzi a parità di salari monetari, sia aumentando la produttività del lavoro (si potrebbero anche ridurre i salari monetari a parità di prezzo, ma questa via è meno agevole da percorrere.). Fra queste strade, gli imprenditori italiani nel corso degli anni settanta, hanno scelto di preferenza la seconda.

Il grande processo di ristrutturazione cui abbiamo detto in precedenza, è servito non soltanto e non tanto a ridurre il costo monetario del lavoro, quanto ad accrescerne la produttività attraverso una maggiore intensità del lavoro, un allungamento degli orari, un uso maggiore degli straordinari, una più ampia mobilità fra reparti e fra mansioni, e via dicendo.

Se negli anni settanta, gli imprenditori italiani hanno puntato tutta la loro attenzione sul problema della ristrutturazione come mezzo per accrescere il rendimento della forza lavoro, essi hanno mostrato invece interesse molto minore per la compressione del costo monetario del lavoro.

Sul terreno del salario monetario, gli imprenditori italiani degli anni decorsi, si mostravano assai più cedevoli, sapendo di poter contare su meccanismi compensativi. Ogni aumento del costo monetario del lavoro poteva essere compensato prontamente da un aumento dei prezzi ed ogni aumento dei prezzi interni veniva con altrettanta prontezza seguito da una svalutazione esterna della lira, in modo che le esportazioni italiane non ne venissero danneggiate.

Questa spirale sistematica di aumento dei prezzi, aumento dei salari, e svalutazione della lira finiva con il rendere gli imprenditori italiani insensibili al problema del costo monetario del lavoro, problema che ai loro occhi appariva come meramente nominalistico.

Tutti ricordano che, quando si cominciò a discutere di riforma della scala mobile, nel mezzo della polemica, nel maggio del 1981, giunse dagli Stati Uniti un articolo di Franco Modigliani, autorevole mentore d’oltre oceano, il quale ammoniva appunto gli esperti italiani che si affannavano a ideare meccanismi di scala mobile non inflazionistici, ricordando che il problema autentico non era quello di ridurre il costo monetario del lavoro, bensì quello di aumentarne la produttività.

Con questo intervento, Modigliani interpretava correttamente lo stato d’animo degli imprenditori italiani di allora, tutti tesi a riconquistare il controllo della forza lavoro, e disattenti invece sul terreno delle grandezze monetarie.

Dopo di allora, la discussione si è trascinata stancamente, nell’idea che la spirale prezzi-salari-cambi esteri dovesse rompersi partendo da una stabilizzazione dei salari o dei prezzi interni. Ma poiché la stabilizzazione dei prezzi avrebbe dovuto essere realizzata dagli imprenditori e poiché gli imprenditori non avevano alcun interesse immediato a realizzarla, potendo contare sulle svalutazioni ricorrenti della lira, non vi è da stupirsi che la spirale abbia proseguito senza posa.

Infatti la svalutazione della lira è continuata anche dopo, l’entrata in vigore del Sistema monetario europeo: si può calcolare che dal marzo del 1979 a oggi, sommando le svalutazioni della lira e le rivalutazioni del marco, la lira si sia svalutata rispetto al marco non meno del 20 per cento.

La linea del ministro Andreatta ha tentato per la prima volta di capovolgere la situazione. La tesi di Andreatta è stata fin dall’inizio che la spirale prezzi-salari-cambi dovesse essere interrotta non già a partire dalla stabilizzazione dei prezzi interni, bensì a partire dalla stabilizzazione dei cambi esteri.

Per sua convinzione, Andreatta è stato sempre contrario alla svalutazione della lira, manovra che, a suo avviso, e non soltanto a suo avviso, alimenta inesorabilmente l’inflazione, ed è sempre stato incline ad operare invece una politica di stabilità dei cambi esteri, o addirittura di rivalutazione della lira, nella convinzione che per questa via si possa ridurre il costo delle importazioni e stabilizzare anche i prezzi interni.

È cosa nota del resto che in tutte le trattative comunitarie, Andreatta si è sempre espresso contro le svalutazioni ed ha accettato di svalutare la lira soltanto nei limiti in cui vi è stato costretto.

Da quando è diventato ministro, Andreatta si è quindi messo all’opera per stabilizzare anzitutto i cambi esteri. La manovra non si presentava facile sotto il profilo tecnico; anzi, stabilizzare il valore esterno della lira mentre l’inflazione italiana continuava a superare di gran lunga l’inflazione europea poteva parere una manovra perdente in partenza.

Per sostenere il valore esterno della lira, Andreatta non ha esitato a fare ricorso ad un indebitamento estero crescente cercando al tempo stesso di comprimere le importazioni con una manovra monetaria restrittiva.

E’ accaduto così che, nonostante l’intenzione e nonostante il disavanzo della bilancia commerciale, la svalutazione della lire è-stata assai ridotta. Non. poche voci autorevoli, ivi compresa quella del Direttore generale del Tesoro Sarcinelli, si sono levate a recriminare il livello eccessivo dell’indebitamento che nel 1981 ha raggiunto i 41000 miliardi di lire,superando il 10 per cento del prodotto interno lordo (nel 1980 non  raggiungeva il 7 per cento).

Ma prima di recriminare occorre rendersi conto del fatto che questo indebitamento non rappresenta un obiettivo bensì uno strumento, il cui scopo finale dovrebbe essere quello di stabilizzare anche il livello dei prezzi interni. Quello che va se mai sottolineato è la manovra politica con la quale il governo è riuscito a procurarsi tanto credito e tanta fiducia nei  mercati finanziari internazionali: una manovra fatta di lotta al terrorismo, di repressione, di demonizzazione del sindacato, che evidentemente alla finanza mondiale deve essere piaciuta molto.

La politica di Andreatta ha riscosso un primo palese successo, non definitivo, ma certamente significativo.

Mentre, in passato, come abbiamo detto, gli imprenditori italiani erano stati poco attenti alle grandezze monetarie, oggi la loro posizione ha subito un capovolgimento completo.

Gli imprenditori si sono trovati improvvisamente stretti da un cambio estero assai meno flessibile del previsto che ha impedito loro di compensare con la svalutazione gli aumenti dei prezzi. Al tempo stesso essi si sono trovati a corto di liquidità in virtù di una politica di restrizioni creditizie che, sotto il governo di Andreatta, ha assunto per la prima volta toni seri e concreti.

In passato, le così dette strette creditizie si riducevano ad un aumento dei tassi di interesse senza restrizione simultanea della base monetaria. E’ vero che in teoria le due cose dovrebbero operare l’una a ruota dell’altra: un aumento dei tassi di interesse dovrebbe indurre le imprese a ridurre il loro indebitamento, riducendo per questa via la liquidità dell’intera economia.

Ma se gli imprenditori possono contare su una espansione della quantità di moneta, anche di fronte ad un aumento dei tassi di interesse essi non hanno alcuna ragione di ridurre la propria attività.

Essi cercheranno al contrario di compensare l’aumento dei tassi di interesse e l’aumento dei costi che esso induce, mediante un aumento dei prezzi e, se le autorità monetarie, aumentando la quantità di moneta, fanno in modo che tale aumento possa realizzarsi davvero, tutto si risolve in un’ondata di inflazione.

L’aumento dei tassi di interesse, che le autorità monetarie italiane hanno presentato tante volte come manovra di stabilizzazione, si è tradotto infatti altrettante volte in un contributo all’accelerazione dell’inflazione. Per la prima volta, Andreatta, fidandosi poco delle ricette da manuale e facendo assegnamento sul suo fiuto concreto, ha capovolto la situazione ed ha agito direttamente sulla quantità di moneta, operando una stretta creditizia in piena regola. La base monetaria, che nel 1978 era arrivata a crescere del 25 per cento, negli ultimi due anni è cresciuta appena del 13 per cento.

Uno strumento rigoroso utilizzato in questa direzione nel 1981 è stato il deposito infruttifero a fronte di pagamenti esteri, che da solo ha operato una distruzione di base monetaria di 3.800 miliardi.

Gli imprenditori italiani si sono trovati dunque stretti in una tenaglia. Da un lato, l’aumento dei prezzi diventava sempre più difficile perché le autorità monetarie non erano più disposte a finanziarlo mediante aumenti della liquidità; dall’altro, nella misura in cui era ancora possibile accrescere i prezzi, l’operazione si traduceva in una perdita netta di competitività nei mercati esteri. Per gli imprenditori italiani è quindi diventato urgente comprimere il costo monetario del lavoro.

Il voltafaccia degli imprenditori sul  terreno del salario monetario non si è  lasciato attendere. Come tutti sanno, il 1° giugno la Confindustria ha denunciato l’accordo sulla scalamobile del 1975 (lo stesso accordo che era stato raggiunto dopo una trattativa distesa, condotta dall’allora presidente Gianni Agnelli); alla fine dello stesso mese. con una procedura un tantino più travagliata, anche le imprese a partecipazione statale, attraverso l’Intersind. prendevano la stessa decisione.

Sul terreno della politica salariale. Andreatta, nel giro di pochi mesi, ha convertito gli imprenditori italiani da avversari in alleati. L’auspicio da lui espresso nel febbraio di quest’anno a Bruxelles, all’indomani della sospensione della scala mobile in Belgio, di poter presto celebrare il requiem anche per la scala mobile italiana, l’ultimo meccanismo di indicizzazione europeo, acquista ora maggiori probabilità di realizzazione concreta.

La politica monetaria restrittiva del ministro del Tesoro ha creato vincoli non indifferenti sul terreno del debito pubblica Qui la linea di Andreatta si ispira a due esigenze diverse, ma nel concreto convergenti. La prima, già ricordata, è quella di ridurre la liquidità del sistema economico; in Omaggio a questa esigenza, le autorità hanno tentato di ridurre la quota del disavanzo pubblico finanziato attraverso il ricorso all’istituto di emissione, cercando invece di accrescere la quota del disavanzo coperta dal gettito fiscale o da emissione di titoli collocati  regolarmente sul mercato.

Questo così detto divorzio fra Banca d’Italia e Tesoro è stato accompagnato, sempre nell’intento di ridurre la creazione di liquidità ad opera del tesoro, dalla pratica di emettere titoli anche per finanziare i pagamenti per interessi, il che, nei limiti in cui riesce, equivale a pagare gli interessi sul debito pubblico in titoli anziché in moneta. Ne sono scaturiti due effetti inevitabili, e per ciò stesso previsti: che le emissioni lorde di titoli del debito pubblico sono rapidamente cresciute, ma che al tempo stesso la creazione di liquidità ad opera del Tesoro si è ridotta.

Mentre l’indebitamento del settore statale fra il 1978 ed il 1981 è passato dal 62 per cento al 65 percento del prodotto interno lordo, il ricorso netto al mercato mediante emissione di titoli e di buoni ordinari del Tesoro è sceso dal 9,2 per cento al 7,9 per cento. Il castello di debito pubblico che, per le sue dimensioni crescenti, fa inarcare il sopracciglio dei puristi della finanza pubblica, una volta analizzato nelle sue dimensioni effettive si rivela per  un castello di carta e le sue conseguenze sulla creazione di liquidità appaiono del tutto inconsistenti.

La seconda esigenza che spinge il ministro del Tesoro a vedere con favore una riduzione della spesa pubblica riveste contenuto assai diverso e si connette ad obiettivi di carattere politico. Andreatta appartiene a coloro che apprezzano le virtù del mercato più di quelle dell’intervento pubblico, che considerano la spesa pubblica un pericoloso veicolo di corruzione e di clientelismo. La sua adesione sul terreno politico ai tentativi di rifondazione della Dc lo conducono, sul terreno economico, ad una politica di severo controllo delle uscite pubbliche. Può darsi che questa posizione sia assunta in piena buona fede; il suo realismo, come diremo fra breve, non può non destare seri dubbi.

Gli interrogativi suscitati da una linea tecnicamente e politicamente così complessa sono numerosi. Proviamo ad enumerarli:

1) Primo quesito: la manovra stabilizzatrice di Andreatta, che esige una stabilizzazione del cambio prima di avere stabilizzato i prezzi, implica come ingrediente tecnico necessario un gravoso indebitamento estero. Ammesso che la manovra riesca e che la stabilizzazione monetaria venga raggiunta davvero, come verrà rjpagato il debito contratto? La via classica sarebbe, una volta raggiunto l’obiettivo della stabilizzazione, di proseguire nella deflazione, in modo da tenere le importazioni al di sotto delle esportazioni per un periodo sufficiente a ripagare il debito estero.

Non si direbbe però che il ministro del Tesoro, uomo di fertile fantasia economica e finanziaria, voglia battere una strada così scolastica e culturalmente piatta, addossandosi per di più, lui che si è sovente dichiarato keynesiano, un marchio di monetarista infame..

Una seconda strada potrebbe essere quella di portare la manovra di stabilizzazione al di là dell’obbiettivo dichiarato, riducendo il tasso di inflazione italiano addirittura al di sotto di quello europeo, in modo da arrivare ad una rivalutazione della lira che riduca in misura consistente l’onere del debito estero. Sarebbe una via elegante, ma rischiosa quanto una puntata alla roulette.

Sembra più probabile che il ministro pensi ad una terza via, che egli stesso ha già cominciato a coltivare, che è quella di convertire gradualmente il debito esterno in debito a lungo termine e in partecipazioni azionarie favorendo l’ingresso di capitale straniero nell’industria italiana. In tal modo, l’industria italiana, dopo essersi indebitata per ragioni urgenti ma transitorie, salderebbe i propri debiti vendendo nel mercato internazionale brandelli del proprio patrimonio. Quale modo migliore per riconfermare la propria fede nell’integrazione internazionale?

2) Secondo quesito: supponendo che i problemi monetari trovino soluzione, che dire delle trasformazioni strutturali impresse all’apparato produttivo? Qui il giudizio è davvero fosco. L’ortodossia europea non solo trasforma l’industria italiana in un apparato privo di ambizioni tecnologiche, ma la rende anche legata alle vicende economiche e valutarie della Cee. La politica valutaria italiana ha dato i suoi frutti quando la lira è riuscita a muoversi tra marco e dollaro lungo il sentiero più favorevole; ma nessuno garantisce che questa situazione possa riprodursi in avvenire.

Oggi, ad esempio, ci troviamo a navigare in acque tutte diverse: rispetto al marco la lira tende a restare stabile, mentre l’ascesa irresistibile del dollaro la costringe a svalutarsi verso la moneta statunitense.

Qui vengono inesorabilmente al pettine i nodi di una politica industriale a senso unico. Se le esportazioni italiane fossero state consapevolmente orientate verso tutti i mercati mondiali, se l’area del dollaro fosse stata coltivata con adeguata penetrazione commerciale, se, alla stregua della Germania o del Giappone, anche gli esportatori italiani fossero presenti in tutti i mercati, la rivalutazione del dollaro verrebbe oggi come un’occasione d’oro offertaci spontaneamente dagli Stati Uniti, per espandere le esportazioni italiane nell’area del dollaro, e potrebbe quindi rappresentare un evento favorevole. Viceversa, dopo anni ed anni di passione europea, l’industria italiana si trova nell’impossibilità di sfruttare l’occasione favorevole, e la rivalutazione del dollaro si abbatte sul paese come una tempesta, che accresce spaventosamente il costo delle importazioni, senza darci nulla o quasi nulla in cambio.

Ecco quindi che, di fronte a un dollaro che punta senza sosta verso l’alto, le autorità economiche sono costrette a correre ai ripari, senza sapere più quali strumenti escogitare per comprimere le importazioni, e con esse la produzione e l’occupazione.

3) Terzo quesito: se sul fronte internazionale l’industria italiana è davvero collocata male, sul fronte interno la situazione rischia di essere ancora peggiore, sul piano degli squilibri territoriali.. Le regioni del Centro-Nord sono avviate a raggiungere un loro equilibrio, basato sulla diffusione territoriale della media industria, su di una utilizzazione intensa della forza lavoro attraverso il decentramento produttivo e la diffusione del doppio lavoro, e senza più fare ricorso come in passato a mano d’opera di importazione (l’immigrazione nelle regioni del Centro Nord è ormai limitata a quella forma di occupazione che la mano d’opera locale tende a rifiutare).

Del tutto opposta la situazione del Mezzogiorno. Qui il venir meno della grande industria ha ulteriormente ridotto quelle poche isole di occupazione stabile che l’industrializzazione degli anni sessanta aveva creato; al tempo stesso, l’arresto dell’emigrazione, sia verso le regioni del Nord che verso gli altri paesi europei, aggrava ulteriormente la situazione del mercato del lavoro.

Le prospettive del Mezzogiorno non sono mai state così tetre, e a giudicare dalle linee di azione che sembrano emergere si direbbe che la classe responsabile non si sia ancora resa conto della gravità del problema.

Una prima linea è quella di conservare il Mezzogiorno nel suo stato di enorme riserva di disoccupati, utilizzando le forme già in atto di sussidi palesi e larvati che la spesa pubblica fornisce, per tenere il reddito ad un livello accettabile, e utilizzando al tempo stesso il collaudato sistema clientelare democristiano per controllare l’equilibrio politico.

Una linea tranquilla, questa, che vanta ripetuti successi nel passato, e che non può riscuotere il consenso dei ceti dominanti del Sud. E però una linea che si pone in conflitto totale con gli ideali di restaurazione del mercato e di riduzione della spesa pubblica clientelare che, stando alle dichiarazioni ufficiali, ispirerebbero gli attuali ministri responsabili.

Una seconda linea è quella di trasformare gradualmente il Mezzogiorno sussidiato in Mezzogiorno produttivo utilizzando la forza lavoro del Sud come riserva di lavoro nero. Sarebbe questa una linea di sviluppo industriale che ripeterebbe il tentativo di industrializzazione accelerata degli anni sessanta, con la differenza sostanziale che, mentre allora si puntò sui grandi impianti e sull’azione dell’industria pubblica, oggi si punterebbe sul lavoro disperso e sull’iniziativa privata.

Questa seconda linea conta appoggi concreti fuori del Mezzogiorno: le regioni del Centro-Nord vi scorgono un modo per proseguire nel proprio sviluppo senza ulteriori importazioni di mano d’opera, utilizzando il lavoro del Sud come prolungamento decentrato dell’industria settentrionale È chiaro d’altro canto che una soluzione simile per tradursi in realtà, dovrebbe ottenere consensi non soltanto dall’esterno ma anche all’interno del Mezzogiorno, il che richiede una molto più sottile opera di mediazione fra industria del Nord e notabilato locale.

Non si può escludere che i vertici del potere economico e politico, rappresentati dalla Confindustria e dalla Dc nelle persone di Merloni e di De Mita puntino proprio ad un compromesso di questa natura.

Nell’uno come nell’altro caso, la classe lavoratrice del Mezzogiorno, ridotta al rango di popolazione sussidiata o a quello di mano d’opera disgregata verrebbe cancellata dalla scena  politica del paese, mentre le ormai tradizionali e sempre risorgenti figure della borghesia di stato troverebbero ancora una volta sostegno e conferma..

È proprio qui, in questa posizione di antimeridionalismo convinto, che la politica monetaria di Andreatta e la politica industriale di Merloni trovano il loro punto di più solida saldatura.

Da “Seven deadly innocent frauds of economic policy” di Warren Mosler

18 Nov

Dalla parte prima di “Seven deadly innocent frauds of economic policy”

 di Warren Mosler

(con preghiera di scusare la mia traduzione,qualsiasi contributo a migliorarla è benvenuto)

Micidiali innocenti frodi n.1:

Il governo federale deve raccogliere fondi attraverso la tassazione o l’indebitamento al fine di spendere. In altre parole, la spesa pubblica è limitata dalla sua capacità di tassare o prendere in prestito.

La verità:

La spesa del governo federale non è in alcun caso operativamente vincolata dai ricavi, il che significa che non esiste un “rischio di solvibilità.” In altre parole, il governo federale può sempre fare tutti gli eventuali pagamenti nella propria valuta, non importa quanto grande il deficit è, o quanto siano scarse le tasse che raccoglie.

Chiedete a qualsiasi membro del Congresso (come ho fatto più volte) o a un privato cittadino come il tutto funziona, e lui o lei vi dirà con enfasi che: “… il governo deve o tassare o indebitarsi per ottenere i fondi da spendere, proprio come qualsiasi famiglia deve ottenere in qualche modo i soldi di cui ha bisogno per spendere. E da qui derivano gli inevitabile problemi su sanità, difesa, sicurezza sociale, e ogni e qualsiasi spesa pubblica:

Come avete intenzione di pagare per questo ??? !!!

Questa è la domanda assassina, a cui nessuno risponde correttamente, e ottenere la risposta a questa domanda correttamente è il nucleo dello scopo civile posto a fondamento dello scrivere questo libro.

Nei prossimi brani, tutto vi sarà rivelato senza nessuna teoria e nessun filosofia – solo alcuni fatti nudi e crudi. Rispondo a questa domanda prima guardando esattamente come il governo tassa, e in seguito come il governo spende.

Come funziona l’imposta del governo federale?

Cominciamo guardando cosa succede se si pagano le tasse con un assegno. Quando il governo degli Stati Uniti ottiene il vostro assegno, ed è depositato ed “estinto”, tutto quello che il governo fa è cambiare il valore nel vostro conto corrente “in diminuzione“ dal momento che si sottrae l’importo del vostro assegno dal vostro conto in banca. Il governo effettivamente ottiene qualcosa di reale da dare a qualcun altro? No, non c’è una qualche una moneta d’oro da spendere. Si può vedere come ciò avvenga con l’online banking – guarda il saldo del tuo conto in banca sullo schermo del computer. Supponiamo che il saldo nel tuo conto è di $ 5.000 e tu scrivi un assegno al governo per $ 2,000. Quando l’assegno viene estinto (viene processato), cosa succede? Il 5 si trasforma in un 3 e il nuovo saldo è ora ridotto a $ 3.000. Tutto davanti ai tuoi occhi! Il governo non ha in realtà “ottenuto” nulla da dare a qualcun altro. Nessuna moneta d’oro è caduta in una borsa alla Fed. Hanno appena cambiato i numeri in conti bancari – niente “è andato” da qualche parte.

E cosa succede se si dovesse andare al vostro ufficio locale delle tasse per pagare le tasse con denaro reale? In primo luogo, si dovrebbe consegnare il mucchio di valuta all’impiegato di turno come pagamento. Poi, questi dovrebbe contarlo, vi darà una ricevuta e, si spera, un ringraziamento per aver contribuito a pagare per la sicurezza sociale, gli interessi sul debito pubblico, e la guerra in Iraq. Poi, dopo che tu, cioè il contribuente, lascerà la stanza, egli prenderebbe questi sudati soldi che hai appena sborsato e li getterebbe in un trituratore.

Sì, si buttano via. Distrutti! Come mai? Non esiste un ulteriore uso per essi. Proprio come un biglietto per il Super Bowl. Dopo essere entrato nello stadio e consegnato all’addetto un biglietto che valeva forse $ 1000, lo strappa e la scarta. In realtà, si possono effettivamente acquistare soldi tagliuzzati a Washington, DC

Quindi, se il governo butta via il vostro denaro dopo averlo raccolto, come fa che pagare in contanti per qualsiasi cosa, come la sicurezza sociale e il resto della spesa da parte del governo? Non è così.

Ora è possibile vedere perché non ha senso quello che tutti pensate che il governo deve ottenere denaro tassando al fine di spendere? In nessun caso può in realtà “ottenere” tutto ciò che successivamente “utilizza”. Quindi, se il governo in realtà non ottiene nulla quando tassa, come e cosa spende?

Come il governo federale spende

Immaginate di aspettarvi i vostri $ 2.000 di pagamento di pensione per accrescere il vostro conto in banca, che ha già 3.000 $ depositati. Se state guardando il vostro conto sullo schermo del computer, è possibile vedere come il governo spende senza aver nulla da spendere. Oplà! Improvvisamente il vostro estratto conto che leggevate con 3000 $ ora leggete $ 5.000. Che cosa ha fatto il governo per darvi quel denaro? Ha semplicemente cambiato il numero nel vostro conto in banca da 3.000 a 5.000. Non ci vuole una moneta d’oro e un martello in un computer. Tutto ciò che ha fatto è stato cambiare un numero nel vostro conto in banca, ponendo  dei dati sul proprio foglio di calcolo, che è legata ad altri fogli di calcolo nel sistema bancario. La spesa pubblica è tutta fatta con l’inserimento di dati sul proprio foglio di calcolo chiamato “Il sistema monetario del dollaro americano.”

Ecco una citazione dal buon presidente della Federal Reserve Bank, Ben Bernanke, a “60 minuti” a sostegno:

SCOTT PELLEY: È il denaro delle tasse quello che la Fed sta spendendo?

Il presidente Bernanke: Non è il denaro delle tasse. Le banche hanno conti presso la Fed, più o meno allo stesso modo in cui lei dispone di un conto in una banca commerciale. Così, per prestare ad una banca, usiamo semplicemente il computer per aumentare le dimensioni del conto che essi hanno con la Fed.

Il presidente della Federal Reserve Bank ci sta dicendo in un inglese semplice che danno i soldi (spendono e prestano) semplicemente cambiando i numeri di conti bancari. Non esiste una cosa come dover “ottenere” le tasse (o prendere in prestito) per costituire una voce del foglio di calcolo che noi chiamiamo “la spesa pubblica.” I dati del computer non vengono da nessuna parte. Tutti sanno questo!

Dove altro vediamo che questo accade? La tua squadra calcia un goal e sul tabellone, il punteggio cambia da, diciamo, 7 punti a 10 punti. Qualcuno si chiede dove lo stadio ha preso questi tre punti? Ovviamente no! O tu abbatti 5 birilli al bowling e il tuo punteggio va da 10 a 15. Vi preoccupate da dove il bowling ha preso questi punti? Pensi che tutte le piste da bowling e gli stadi di calcio dovrebbero avere una ‘riserva di punti’ in una “scatola chiusa a chiave” per assicurarsi la possibilità di disporre dei punti che hai segnato? Ovviamente no! E se il bowling scopre che “si è commesso fallo di piede” e abbassa il punteggio di 5 punti, il bowling ora ha più punteggio a dare? Ovviamente no!

Sappiamo tutti come funziona l’immissione dei dati, ma in qualche modo questo è stato capovolto e rivoltato dai nostri politici, i media, e, la maggior parte, di tutti gli economisti tradizionali di larga diffusione.

Basta tenere a mente come punto di partenza: Il governo federale giammai “possiede” o “non possiede” nessun dollaro.

E’ proprio come lo stadio, che non “possiede” o “non possiede” un tesoro di punti da dare. Quando si tratta di dollari, il nostro governo, lavorando attraverso le sue agenzie federali, la Federal Reserve Bank e il Dipartimento del Tesoro degli Stati Uniti, è il custode del punteggio. (E fa anche le regole!).

Ora avete la risposta operativa alla domanda: “Come faremo a pagare per questo” E la risposta è: nello stesso modo il governo paga per qualcosa, cambia i numeri nei nostri conti bancari.

Il governo federale non sta  “a corto di soldi”, come il nostro presidente ha erroneamente ripetuto. Questo non esiste. Né dipende dal “prendere” dollari dalla Cina o da altrove. Tutto ciò che serve per il governo per spendere è il cambiare i numeri in conti bancari presso la propria banca, la Federal Reserve Bank. Non c’è limite numerico di quanti soldi il nostro governo può spendere, ogni volta che vuole spendere. (Questo include i pagamenti di interessi, così come i pagamenti della Social Security e Medicare.) Esso comprende tutti i pagamenti pubblici effettuati in dollari a chiunque.

Questo non significa che la spesa pubblica eccessiva non potrà eventualmente causare la salita dei prezzi (che è l’inflazione). Ma significa che il governo non può andare in rovina e non può andare in bancarotta. Semplicemente non esiste tale fatto.

Allora perché nessuno nel governo sembra capirlo? Perché allora il Comitato Ways and Means nel Congresso si preoccupa di “come pagheremo questo?” Potrebbe essere che credono all’idea  popolare che il governo federale, così come tutta la famiglia, deve in qualche modo prima “fare provvista” dei soldi per essere in grado di spendere. Sì, hanno sentito che è diverso per un governo, ma non ci credono completamente, e non c’è mai una spiegazione convincente che ha senso per loro.

Quello che tutti sembrano perdere è la differenza tra lo spendere la propria valuta che solo voi create, e spendere moneta creata da qualcun altro. Per utilizzare correttamente questa comune analogia governo federale/famiglia in modo sensato, vedremo successivamente un esempio di una “valuta” creato da una famiglia.

La storia inizia con dei genitori che creano dei tagliandi che poi utilizzano per pagare i loro bambini per fare vari lavori domestici. Inoltre, per “controllare il modello”, i genitori richiedono i bambini di pagare loro una tassa di 10 tagliandi alla settimana per evitare una punizione. Questo replica strettamente la fiscalità nell’economia reale, dove dobbiamo pagare le tasse o affrontare sanzioni. I tagliandi sono ora la nuova valuta domestica. Pensate ai genitori che “spendono” questi tagliandi per l’acquisto di “servizi” (faccende domestiche), dai loro figli. Con questa nuova moneta per la casa, i genitori, come il governo federale, sono oggi l’emittente della propria valuta. E ora si può vedere come una famiglia con una propria moneta è infatti molto simile ad un governo con una propria moneta.

Cominciamo ponendo alcune domande su come funziona questa nuova moneta per la casa. I genitori devono fare in qualche modo per ottenere i tagliandi dai loro figli prima di poter pagare i propri tagliandi ai loro figli per fare i lavori? Ovviamente no! In realtà, i genitori devono prima spendere i loro tagliandi per pagare i loro figli per fare le faccende domestiche, per essere in grado di acquisire il pagamento di 10 tagliandi alla settimana dai loro figli. In quale altro modo possono i bambini ottenere i tagliandi che essi devono ai loro genitori?

Allo stesso modo, nell’economia reale, il governo federale, proprio come questa famiglia con i propri tagliandi, non ha bisogno di ottenere i dollari che spende dalla tassazione o dall’indebitamento, o in qualsiasi altro modo, per essere in grado di spenderli. Con la tecnologia moderna, il governo federale non ha nemmeno bisogno di stampare i dollari che spende nel modo in cui i genitori stampano i propri tagliandi.

Ricordate, il governo federale non possiede né non possiede dollari, più di quanto il bowling possieda mai una scatola con i punti. Quando si tratta di dollari, il nostro governo federale è il segnapunti. E quanti tagliandi fanno i genitori nella storia dei tagliandi tra padre / figlio? Non ha importanza. Potrebbero anche solo scrivere su un pezzo di carta il numero di tagliandi di cui i bambini sono debitori, quanti ne hanno guadagnato e quanti hanno pagato ogni mese. Quando il governo federale spende, i fondi non “vengono da” qualche parte più di quanto i punti “vengono da” qualche parte nello stadio di calcio o la pista da bowling. Né la riscossione delle imposte (o il prestito) in qualche modo aumentano “tesoro di fondi” del governo disponibili per la spesa.

L’oliva di Eric Baume – La situazione greca è un ricorso della storia?

6 Feb

Lapide ad Armando RizzenteNon so se questo testo sia coperto ancora da copyright, e non saprei a chi chiedere l’autorizzazione per ripubblicare questo racconto di Eric Baume che descrive la morte per fame a cui venne sottoposta la popolazione greca dall’occupazione germanica  durante la seconda guerra mondiale.

Lessi questo testo dalla rivista “Il Mese” pubblicata clandestinamente in Italia dagli Alleati per darci informazione gelosamente nascoste dal regime nazi-fascista perché era nella biblioteca di mio padre che lo acquistava con pericolo personale, anche se questo certamente non era il maggior pericolo che avesse corso come antifascista.

Considero importante riportare questo brano per far sapere, a chi legge, come la concezione etica del nazismo sia ancora perdurante e fortemente incisa nell’animo dei tedeschi che hanno oggi il potere e che questa mentalità sia in fase di esportazione anche nei  paesi che hanno combattuto questo scempio della concezione della morale laica. In sostanza si riscontra nel modo di pensare di questi politici che oggi stanno riportando alla fame la Grecia il principio che l’etica consiste nell’adeguarsi al modo di pensare e di agire comune della popolazione. Pertanto se, come accadde con il nazismo ed oggi accade con i principi del liberismo radicale comunemente praticato,  si convincono i cittadini che il popolo greco debba fare la fame e molti debbano morire prematuramente, ciò è eticamente corretto e chi si oppone è un populista o un asociale.

Ricordiamoci che il boia Priebke presentò proprio questo argomento a sua difesa e non si ritenne mai colpevole in quanto aveva eseguito quanto nella sua terra era considerato eticamente corretto.

Se l’unione europea è un ritorno al nazifascismo occorre opporsi a questa come hanno fatto le persone illuminate che spesso per questo hanno perso la vita.

Come annotazione a sostegno del fatto che questa politica è assolutamente irrazionale ricordo che Wittgenstein, all’epoca fuggito dall’Austria per salvarsi dal quel suo compagno teppista della scuola elementare- Hitler-, inseguì con un attizzatoio Popper in una riunione dell’Aristotelian Society perché le idee che aveva espresso comportavano severi errori di logica e giustificavano proprio chi lo voleva uccidere solo perché non si era adeguato alla concezione socio-economica del nazismo.

Questo è il racconto:

ERIC BAUME

L’oliva

Da Modern Reading (Ristampa autorizzata degli Editori Wells, Gardner, Darton & Co. per Il Mese – London The Fleet Street Press- Febbraio 1944)

Gli idrovolanti britannici da Brindisi e da Creta usavano ormeggiarsi alle boe, vicino alla sua casupola.

D’estate, dopo la scuola, il ragazzo faceva invariabilmente tappa sull’assolata litoranea percorsa dai tranvai che portavano dal Pireo ad Atene. Appoggiato al muricciolo osservava, la risacca, le brevi onde increspate che dalla lontana Milo mormoravano nel risucchio, misteriose. Sapeva, il ragazzo, che alcune di quelle onde avevan lambito la galèa di Giasone, che altre s’erano allontanate veloci dalle sabbie di Creta per sfuggire al Minotauro.

Sapeva queste cose ed altre, perché Anacreonte Leonida, il suo maestro, gliele aveva pazientemente raccontate e gli aveva persino regalato una cartolina illustrata con l’immagine del Monte Ida incappucciato di neve.

Quando i brividi d’autunno scendevano dalle montagne albanesi e il cielo si faceva buio sul mare d’Egitto, il ragazzo contemplava le plumbee nuvole che navigavano sul golfo, varcando lente le colline dell’istmo di Corinto per poi stendersi ampie sull’Acropoli, oscurando cielo e marmi. L’idrovolante si era ormeggiato.

E allora era una festa sedersi sul molo e udire gli inglesi parlare con quei suoni gutturali quasi scimmieschi. Ridevano sempre, questi inglesi, il ragazzo lo ricordava, e gli regalavano tavolette di cioccolata che chiamavano “frai” o “ron-trii”, ed era cioccolata buona e dolce.

Avevan saputo che si chiamava Demetrio e lo avevano ribattezzato Demy, tutti, anche Alfos il cameriere di bordo.

Un giorno il suo piccolo amico Senofonte Servitopoulos, il figlio del vigile urbano, lo aveva accompagnato e gli inglesi avevan dato cioccolata pure a lui. Alla partenza dell’idro Demetrio, di buon mattino, era alla pensilina a salutarli prima ancora che arrivassero i torpedoni dall’albergo Gran Bretagna, un posto misterioso (gli raccontava sua madre che vi portava spesso la biancheria lavata) ove gli inglesi e gli americani pagavano trecento dracme l’una certe bibite strane.

Una volta Alfos lo aveva fatto salire a bordo e, in assenza del pilota, gli aveva mostrato la cabina di comando. Poi gli aveva regalato due scellini inglesi. Il giorno dopo, il maestro aveva spiegato a tutta la classe l’imponente valore di quella somma. Anche sua madre ne era rimasta impressionata, il che non l’aveva distolta, però, dal cambiare i due scellini in dracme. Il fatto memorabile si ricollegava nella sua memoria con le dieci olive “forestiere” che lui e la sorellina avevan ciascuno mangiate quella sera. Erano olive grosse, d’un ovale oscuro, immerse in un olio così denso che, ad immergervi un fiammifero (se l’avesse avuto), vi sarebbe rimasto dritto in piedi. Quella sera la madre gli aveva raccontato le meraviglie di Mirabella, il villaggio cretese donde era emigrata anni prima. Suo padre possedeva allora un branco di capre e lei, a quei tempi, non era così povera come lì, in quei dannati sobborghi di Atene. A Mirabella si mangiava l’avrolemono, la zuppa di uova e di limoni, e belle fette di carne al riso, e ci si vestiva di soffice lana d’angora che teneva caldo anche nelle notti gelate d’inverno sulle cime dei colli. Dieci olive . . . e si era coricato beato a fianco della madre sul duro pagliericcio, dal quale talvolta uscivan fili d’erba secca, duri come fuscelli, che gli solleticavano la schiena. Com’era cara sua madre! Quando ritornava da scuola Demetrio trovava sempre il piatto colmo sulla tavola. Un giorno avrebbe compiuto otto anni e allora se ne sarebbe andato a lavorare dallo zio Pietro nelle provincie del nord e avrebbe mandato a sua madre tanti regali e tanto cibo. E anche diamanti e oro e, perché no? pure un diadema, un diadema ricco e lucente, più bello di quello di Pope Chrysanthopoulos, che portava i riccioli impomatati e aveva l’alito cattivo.

Un mattino d’estate del 1942 Demetrio compì otto anni. Non v’eran regali, perché sua madre era ammalata. Demetrio pensò: “Il giorno che se ne vanno farò io un bel regalo alla mamma.” Si alzò con fatica dal materasso stirandosi le membra come quando era piccolo.

Aveva otto anni, dunque era un uomo, dunque non aveva bisogno di lavarsi. Nessuno costringe gli uomini a lavarsi: gli uomini sono “grandi” e possono sputare in terra, come suo padre prima che morisse sotto le ruote di un’automobile. Suo padre, che al mattino quando si alzava di buon’ora rideva forte, sputava, e irradiava forza e allegria persino dai mustacchi; anche sua madre rideva, allora, perché ‘papà lavorava da sterratore con vanga e piccone, e aveva una paga fissa, e per questo sua madre stava a casa a cucinare e faceva il bucato soltanto per la famiglia.

Demetrio si chinò sulla mamma che respirava a fatica e aveva il viso grigiastro. Di tanto in tanto sospirava, con sospiri lenti e lunghi, un po’ sibilanti. Il ragazzo le portò dell’acqua e un pezzettino di pane nero spolverato di segatura. “Auguri per il compleanno, mamma. Per il mio,” aggiunse dopo un attimo di riflessione, e le porse il pane. La donna socchiuse gli occhi appannati.

Le labbra riarse succhiarono inconsciamente l’acqua, tanto che il liquido bagnò a rivoletti la pelle secca e scabra. Guardò il figlio e gli sorrise senza potergli parlare. Poi chiuse ancora gli occhi e sprofondò nel sonno greve. Demetrio le rincalzò la sudicia coperta e resse nelle sue la mano penzolante dal letto.

Fischiettò per un poco, bevette dell’acqua. Prese il pezzetto di pane (l’aveva trovato per istrada, vicino alla porta del Comando del 19° Fanteria Sassone) e lo pose con cura sul tavolino basso accanto al letto, di guisa che la madre potesse raggiungerlo senza fatica; poi fu assalito dai dolori, come il giorno prima. Cercò di analizzarli. Dopo tutto eran solo dolori che facevano un rumore come d’acqua che bolle e venivano su dall’addome gonfio e duro per la fame – anzi, come diceva lui, dalla sua “pancia di riccone”.

Un gemito lo scosse all’improvviso, perché fa male ad aver fame e le gambe stecchite erano indolenzite dal dover sorreggere un ventre così grosso. Smise di piangere. La madre respirava ora a intervalli irregolari e ad ogni respiro emetteva un breve sibilo. “Mamma,” esclamò, “che suono buffo stia facendo!”

Sorrise al pensiero di come si sarebbe divertita la sorellina, ma essa non c’era più; se ne era andata tanto tempo prima, avvolta in un lenzuolo bianco; se l’era portata via il Pope, e questo era successo subito dopo che i tedeschi avevano ammazzato il maestro “per niente”. “Proprio per niente,” diceva Demetrio, “proprio, e questo è il più strano.”

Dunque aveva otto anni ed era un uomo. “Non parlerò mai a un tedesco,” disse, mentre accarezzava la fronte scottante della madre.

“Non farò mai quello che ha fatto il padre di Lanthos. Sedere con quella gente, accettare da loro il cibo. . . .

Io, il cibo me lo posso trovare da me.

Se avessi avuto otto anni invece di sette, la mia sorellina avrebbe avuto da mangiare: glielo avrei procurato io.”

I dolori lo assalirono nuovamente e lo lasciarono così stremato di forze che dovette stendersi bocconi sul pavimento. Pianse sommessamente.

Sentiva come un coltello nel suo ventre e il coltello non se ne voleva andare. Si alzò e scese pianamente nella strada rumorosa e si avviò al muricciolo della litoranea.

*

Nelle acque del porto si dondolava alla fonda un idrovolante da Salonicco, dipinto con una svastica e croci nere in campo rosso. Demetrio, la faccia cadaverica, si appoggiò al muro perché il corpo lo martoriava. Ma aveva otto anni ed era un uomo, e gli piaceva osservare i meccanici che fissavano le boe, salutavano alla militare e battevano i talloni. Una volta aveva visto anche gli euzoni fare così, e le baionette avevan scintillato al sole mentre il Re li passava in rivista.

Il maestro Leonida aveva portato tutta la classe a una tribuna dello stadio oltre l’Acropoli e tutti avevan applaudito.

Vicino all’edificio dell’idroscalo due uomini trasportavano un tavolo all’aperto. Demetrio si sentiva leggero, più leggero dell’idrovolante e decise di avviarsi rasentando la palizzata. La sentinella tedesca non fece alcun movimento per fermarlo, anzi gli fece un cenno di saluto.

Demetrio non rispose. Vicino alla tavola vide un pezzo di spago. (I dolori all’addome non accennavano a diminuire.) “Adesso posso pescare.” Si curvò a terra, prese una pietruzza dal suolo e la legò allo spago; poi lanciò l’amo improvvisato nell’acqua, stendendosi sul muricciolo, in attesa del pasto che il mare gli avrebbe fornito a buon mercato.

Di lì a poco si’ addormentò.

*

Il colonnello Reichelmann e il capomanipolo delle S.S. Linkrober bevevano e mangiavano all’aperto immersi nel caldo sole del Mediterraneo. Mangiavano e bevevano generosamente, masticando a bocca piena, perché eran di partenza per Brindisi, e a Brindisi si mangiava malissimo, come il colonnello sapeva per esperienza personale. Cosicché, dando prova di previdenza e sagacia, durante il volo da Salonicco il colonnello aveva lanciato un radiomessaggio alla base ordinando zuppa di pollo, tre bottiglie di Chrono e un’anfora di olive sottolio. “Olio

più denso di quello per tingere le canne dei fucili, caro il mio capomanipolo. Un olio da fare andare in sollucchero perfino voi, damerini della Gestapo.” Resi allegri dalle bottiglie risero tutti e due. Il soldato scelto Hinz, attendente, rise anch’egli rispettosamente e pensò che le olive che sarebbero avanzate più tardi toccherebbero a lui, anche se il sapore della salsiccia ne avrebbe sofferto. I due ufficiali chiacchieravano e sputavano i noccioli oltre il muro. La guerra, naturalmente, e le complicazioni. Quei sovversivi di Brindisi‘ che davan fastidio.

Roba da poco, naturalmente; una diecina di fucilazioni e tutto sarebbe andato a posto. Un’oliva un po’ grinza emerse dall’anfora e Reichelmann meccanicamente la gettò.

Fece una parabola e cadde sulla testa di Demetrio: il ragazzo si svegliò.

Stava portandosi l’oliva alla bocca, ma la mano gli si fermò a metà.

Le gambe eran così deboli e il ventre “così pesante che dovette alzarsi lentamente e con estrema fatica. Strinse spasmodicamente il frutto nella mano scheletrica e cominciò a trascinarsi verso la sentinella, arrancando lungo il muro.

L’amo era caduto in acqua. Il colonnello vide il ragazzo. “Tempi duri per questi bimbi,” esclamò. La faccia del capomanipolo non mutò espressione. “Colonnello, siete troppo tenero.” “Oh, lasciamo perdere, lasciamo perdere,” replico il colonnello.

Nella casupola le mosche ronzavano. Mosche grosse, nere, dal corpo azzurro e peloso. Sotto all’umido calore che lo avviluppava tutto e che non riusciva a spiegarsi, Demetrio si scosse, stupito: s’era portato carponi sino a casa. “Ma forse volevo far così . . .. è un gioco anche questo, no? Per far vedere che sono contento di aver il regalo per la mamma. Il regalo del mio compleanno.”

Si avvicinò barcollando alla madre con l’oliva in mano e si accorse che la donna non respirava e che le mosche le si posavan sul viso.

“Dev’esser stanca,” disse a voce alta. “Io, uomo,’ so tutto. Ma sarà contenta ” Raggiunse tentennando la tavola e posò l’oliva accanto al tozzo di pane imbrattato di segatura.

“Quando si sveglierà. dirà che io sono un uomo e che porto l’allegria in casa, come mio padre.” La chiamò due volte. Poi si accoccolò accanto al letto in attesa del risveglio.

I dolori lo colsero di schianto, e guardò disperatamente il pane e l’oliva. mentre il corpo e l’anima soffrivano una lenta agonia. E siccome non era che un bimbo, un piccolo, povero bimbo, pianse a lungo, senza fermarsi, singhiozzando come un uomo “grande”, finché i dolori si dissolsero in una gran luce bianca e splendida, e la testa reclinò dolcemente sulla terra amica.

I principi della conoscenza

11 Gen

Ludwig_Wittgenstein_1910L’ingegneria della conoscenza permette di superare la concezione erroneamente deterministica di Galileo sulla conoscenza della natura.Per Galileo la scienza non è altro che la ricerca delle leggi naturali che sarebbero scritte nella natura stessa.Le conseguenze di questa posizione sono:

1. L’oggettività della conoscenza

2. La possibilità di definire delle leggi universali valide per tutti

3. Una visione materialistica e sostanzialmente atea del mondo in quanto non esiste nessuna necessità né di  un Dio immanente o di un Dio trascendente.

Naturalmente esistono delle oggettive difficoltà ad accettare questa teoria cosmologica ed epistemologica in quanto prescinde da qualsiasi possibilità che si possa interpretare il mondo esterno in modi differenti anche se queste interpretazioni possono risultare, almeno teoricamente, singolarmente coerenti.

La rivoluzione di Ramsey e Wittgenstein è basata sul fatto che del mondo esterno noi abbiamo un’immagine che solo in parte è correlabile con esso in quanto è normale che le immagini del mondo esterno che noi costruiamo sono anche di oggetti da noi inventati o modificati rispetto a quelli che apprendiamo dall’esperienza.

E di questi è impossibile farne a meno se vogliamo fare attività scientifiche. Per altro si tratta di oggetti reali, ancorché non abbiano riscontro diretto nel mondo esterno. E benché ognuno abbia la possibilità di creare questi oggetti nei modi, nei tempi e nelle forme che ritiene opportuni non si può certamente creare una regola per cui alcuni siano eticamente leciti ed altri non lo siano.

Ad esempio in natura non sarà mai possibile trovare una derivata o un’equazione differenziale o, molto più banalmente i numeri, in quanto sono invenzioni umane. In questo caso si tratta di invenzioni accettate. In altri casi vi sono oggetti che non hanno riscontri oggettivi e non sono accettati universalmente. E non si tratta solo di credere o non credere in Dio, ma molto più banalmente di immaginare origini, cause o fenomeni fisici in una formulazione che non viene da tutti riconosciuta o lo è in modo parziale.

Ed esiste in questo un perfetto parallelismo tra il linguaggio e la conoscenza.

Infatti Galileo è come se si fosse fermato alla conoscenza come espressa da S. Agostino nel cap. I par. 8 delle Confessioni: “cum ipsi appellabant rem aliquam, et cum secundum eam vocem corpus ad aliquid movebant, videbam, et tenebam hoc ab eis vocari rem illam, quod sonabat, cum eam vellent ostendere.”

Estendendo il significato del linguaggio alla formulazione del gioco linguistico cadono tutte le barriere e le contraddizioni del linguaggio come riflesso di un’attività ostensiva.

Nello stesso modo la conoscenza del mondo esterno come rappresentazione individuale con regole e strutture individuali determina la caduta di tutte le contraddizioni che regole assolute e predeterminate potrebbero costituire a causa della naturale tendenza all’incoerenza che hanno tutte le regole umanamente determinate.

Ref:

Frank Plumpton Ramsey – The Foundations of Mathematics and other Logical Essays- Edited by R.B. Braithwaite – London Kegan Paul, Trench, Trubner & Co. Ltd – New York: Harcourt Brace and Company – 1931

Ludwig Wittgenstein Philosophische Untersuchungen – edizione italiana a cura di Mario Trinchero – Giulio Einaudi Editore – 1

A MATHEMATICAL THEORY OF SAVING

1 Ott

stanleyOccorre chiarire che l’utilità di una decisione è un numero compreso tra 0 e 1 in quanto si definisce come la probabilità di ottenere la conseguenza migliore per effetto di una decisione.
Inoltre osservo che il lavoro di Frank Ramsey si basa sulla normalità decisionale perché ci si attende che una persona (ovvero un decisore con una durata limitata) o una nazione (ovvero un decisore con durata illimitata) si pongano il problema di quanto e quando spendere per massimizzare l’utilità individuale o nazionale rispettivamente. Purtroppo questi calcoli e questa logica sono stati soppiantati, non solo in Italia, da decisioni politiche che sarebbe stato impossibile prevedere in quanto fuori della logica di massimizzare l’utilità. Ad esempio da più di venti anni le decisioni politiche sono state tali da minimizzare l’utilità con una massimizzazione dell’indebitamento nazionale. Quindi si tratta, evidentemente, di una politica nell’interesse di pochi contro l’interesse nazionale che porta all’impoverimento progressivo della nazione.
Propongo la mia traduzione di questo articolo di Frank Plumpton Ramsey in quanto è una esposizione chiara della soluzione di problemi complessi in modo razionale. Così avrete la possibilità di confrontarla con le incoerenze ed i danni dei politici perpetrati alla nostra nazione ed a noi individualmente.
Il testo originale è stato pubblicato in The Economic Journal Vol. 38, No. 152. (Dic. 1928) pp. 543 – 559, vol. XXXIII – Blackwell Publishing for the Royal Economic Society ed è reperibile sul sito http://www.jstor.org/stable/2224098.

Questa è la traduzione.

UNA TEORIA MATEMATICA DEL RISPARMIO

I

Il primo problema che mi propongo di affrontare è questo: una nazione quanto deve risparmiare del suo reddito? Per rispondere a questo si ottiene una semplice regola valida in condizioni di generalità sorprendente: la regola, che sarà ulteriormente chiarita nel seguito, si sviluppa come segue.

Il tasso di risparmio moltiplicato per l’utilità marginale del denaro deve essere sempre pari all’importo per cui il tasso netto totale di godimento dell’utilità rimane ad disotto del tasso massimo di godimento .

Per giustificare questa regola è, ovviamente, necessario assumere varie ipotesi semplificatrici: dobbiamo supporre che la nostra comunità proceda per sempre, senza cambiare nei numeri né nella sua capacità di godimento né nella sua avversione al lavoro; che godimenti e i sacrifici in tempi diversi possano essere calcolati in modo indipendente e sommati; e che non siano introdotte nuove invenzioni o miglioramenti nell’organizzazione eccetto quelli che possono essere considerati come condizionati esclusivamente da un accumulo di ricchezza. 1

Dovrebbe forse essere sottolineato un punto, più in particolare; si presume che non diminuiamo i godimenti successivi rispetto a quelle precedenti, una pratica che è eticamente indifendibile e deriva solo dalla debolezza della fantasia; noi includeremo, comunque, nella sezione II un tasso di sconto in alcune delle nostre indagini.

Noi ignoriamo anche del tutto considerazioni distributive, assumendo, infatti , che il modo in cui il consumo e lavoro sono distribuiti tra i membri della comunità dipende unicamente dai loro importi totali, in modo che la soddisfazione totale è funzione unicamente di questi importi complessivi.

Oltre a questo , trascuriamo le differenze tra i diversi tipi di beni e diversi tipi di lavoro, e supponiamo questi siano espressi in termini di criteri prefissati, in modo che possiamo parlare semplicemente di quantità di capitali, di consumo e di lavoro senza discutere le loro forme particolari.

1 Ovvero devono essere tali che non avverrebbero senza un certo grado di accumulo, ma potrebbe essere previsto dato il relativo grado .

Non devono essere esclusi il commercio estero, prestiti e mutui, a condizione che assumiamo che le nazioni straniere sono in uno stato stabile, in modo che le possibilità di accordarsi con esse può essere inclusa nelle condizioni di produzione costante. Noi, tuttavia, respingiamo la possibilità che uno stato di indebitamento progressivo con l’estero continui per sempre.

Infine , dobbiamo presumere che la comunità sarà sempre governata dagli stessi  stimoli per quanto riguarda l’accumulo, in modo che non vi sia alcuna possibilità che i nostri risparmi vengano egoisticamente consumati da una generazione successiva; e che non si verifichino sventure da spazzare via gli accumuli in qualsiasi momento nel futuro pertinente.

Quindi indichiamo con x(t) e a(t) i tassi totali di consumo e di lavoro della nostra comunità, e con c (t) il suo capitale al tempo t. Il suo reddito è assunto come una funzione generale delle quantità di lavoro e capitale, e sarà chiamato f ( a, c ); abbiamo poi, dal momento che il risparmio più il consumo deve essere uguale reddito,

Schermata 2014-01-06 alle 18.46.22

Ora indichiamo con U( x ) il tasso totale di utilità di un tasso di consumo x; e con V( a) il tasso totale di disutilità di un tasso di lavoro a, e chiameremo le relative aliquote marginali u (x) e v (a); così che

Schermata 2014-01-06 alle 18.46.48

Supponiamo , come al solito, che u(x) non sia mai in aumento e che v(a) non diminuisca mai.

Ora dobbiamo introdurre un concetto di grande importanza nella nostra discussione. Supponiamo di avere un dato capitale c, e non lo stiamo né aumentando né diminuendo. Allora U(x) – V(a) denota il nostro godimento netto per unità di tempo, e andremo a renderlo massimo, a condizione che la nostra spesa x sia uguale a quella che possiamo realizzare con il lavoro a e il capitale a c. Il tasso di godimento risultante U(x) – V(a) sarà una funzione di c, e crescerà, fino ad certo punto, all’aumentare di c, poiché con più capitale possiamo avere più godimento.

Questo aumento del tasso di godimento con la quantità di capitale può, tuttavia, fermarsi per uno dei due motivi. Potrebbe, in primo luogo, accadere che un ulteriore incremento di capitale non ci permetterebbe di aumentare sia il nostro reddito sia il nostro svago; o, in secondo luogo, potremmo aver raggiunto il tasso massimo concepibile di godimento, e quindi non avremmo alcuna utilità per il maggiore reddito o per il maggiore svago.

In entrambi i casi un certo capitale finito ci darebbe il maggior tasso di godimento economicamente ottenibile, sia che questo sia o non sia il massimo tasso concepibile.

D’altra parte, il tasso di godimento non può mai smettere di aumentare, all’aumentare del capitale. Vi sono poi due possibilità logiche: o il tasso di godimento aumenterà fino all’infinito, o si avvicinerà asintoticamente ad un certo limite finito. Il primo di questi casi si può escludere per il fatto che cause economiche da sole non potrebbero mai darci più di un certo tasso finito di godimento (chiamato sopra il tasso massimo concepibile). Resta il secondo caso, in cui il tasso di godimento si avvicina ad un limite finito, che può essere o può non essere uguale al tasso massimo concepibile. Questo limite si deve chiamare il tasso massimo ottenibile di godimento, anche se non può, a rigore, essere ottenuto, ma solo approssimato indefinitamente.

Quello che abbiamo in vari casi chiamato il tasso massimo ottenibile di godimento o l’utilità chiameremo per brevità Felicità o B. E in tutti i modi possiamo vedere che la comunità deve risparmiare abbastanza o per raggiungere la Felicità dopo un tempo finito, o almeno per approssimarla in un tempo indeterminato. Perché solo in questo modo è possibile raggiungere l’importo per cui il godimento ricade nell’intorno di una felicità somma nel tempo una quantità finita; in modo che se dovesse essere possibile raggiungere la felicità o avvicinarla in un tempo indeterminato, questo sarà infinitamente più desiderabile di ogni altra direzione di azione.

Ed è destinata ad essere possibile, dal momento che mettendo da parte una piccola somma ogni anno siamo in grado nel tempo di aumentare il nostro capitale di una qualsiasi misura desiderata . 1

Abbastanza deve quindi essere risparmiato per raggiungere o approssimarsi alla felicità in un qualche periodo di tempo, ma questo non significa che tutto il nostro reddito deve essere risparmiato. Più viene risparmiato più presto raggiungeremo una felicità, ma meno piacere avremmo adesso, e dovremmo mettere l’una cosa contro l’altra. Keynes mi ha mostrato che la norma che regola la quantità da risparmiare può essere determinata immediatamente da queste considerazioni. Ma prima di spiegare la sua tesi sarà meglio sviluppare quelle equazioni che possono essere utilizzate nei problemi più generali che considereremo più avanti .

1 Così com’è questo argomento è incompleto, in quanto in quest’ultimo caso sopra considerato la felicità era il valore limite, con un capitale che tende all’infinito, del godimento ottenibile spendendo tutto il nostro reddito, e quindi non effettuando alcun accantonamento per un ulteriore aumento del capitale. La lacuna può essere facilmente riempita osservando che per risparmiare £ 1 / n nell’anno n-esimo sarebbe sufficiente aumentare il capitale sociale all’infinito (dal momento che Σ 1 / n è divergente), e che la perdita di reddito (£ 1 / n ) si ridurrebbe allora a zero, in modo che i valori limite di reddito e le spese sarebbero gli stessi .

La prima di queste risulta dall’uguagliare la disutilità marginale del lavoro in qualsiasi momento al prodotto della efficienza marginale del lavoro con l’utilità marginale del consumo in quel momento,

ovveroSchermata 2014-01-06 alle 18.48.00

La seconda uguaglia il vantaggio derivato da un incremento Δx di consumo al tempo t, con quello derivante dal rinviarlo per un periodo di tempo infinitesimale Δt , che aumenterà il suo valore di Schermata 2014-01-06 alle 18.48.23, dal momento che Schermata 2014-01-06 alle 18.48.41           dà il tasso di interesse guadagnato dall’attesa.

Questo dà

Schermata 2014-01-06 alle 18.48.53

o al limite

Schermata 2014-01-06 alle 18.49.04

Questa equazione indica che u(x), l’utilità marginale del consumo, scende proporzionalmente ad un tasso dato dal tasso di interesse. Di conseguenza x aumenta continuamente a meno che o fino a che o Schermata 2014-01-06 alle 18.48.41 o u (x) si annulla, nel qual caso è facile vedere che la felicità  deve

essere stata raggiunta.

Le equazioni ( 1 ) , ( 2 ) e ( 3) sono sufficienti a risolvere il problema purché conosciamo c0, il capitale dato con cui la nazione inizia a t = 0, l’altra “condizione iniziale” essendo fornita dalle considerazioni riguardanti il comportamento della funzione per t → ∞ .

Per risolvere le equazioni procediamo come segue:  notando che x , a e c sono tutte funzioni di una variabile indipendente, cioè il tempo,

abbiamo

Traduzione Schermata 2014-01-06 alle 18.49.25

Di conseguenza , integrando per parti

Traduzione Schermata 2014-01-06 alle 18.51.48

o

Schermata 2014-01-06 alle 18.52.59

Ora dobbiamo individuare K con quello che abbiamo chiamato B, o felicità.

Ciò è più facilmente fatto iniziando in un modo diverso.

Schermata 2014-01-06 alle 18.53.16

rappresenta l’importo per cui il godimento è di poco inferiore alla felicità integrato nel tempo; questo è (o può essere reso) finito, e il nostro problema è quello di minimizzarlo.

Se applichiamo il calcolo delle variazioni da subito, usando l’equazione ( 1 ), otteniamo di nuovo le equazioni ( 2 ) e ( 3); ma se, invece di questo, prima cambiamo la variabile indipendente con c, otteniamo una grande semplificazione. Il nostro integrale diventa

Traduzione Schermata 2014-01-06 alle 18.53.31

Ora, in questa x ed a sono funzioni completamente arbitrarie di c, e per minimizzare l’integrale dobbiamo semplicemente minimizzare l’integrando uguagliando a zero le sue derivate parziali. Prendendo la derivata rispetto a x si ottiene:

Traduzione Schermata 2014-01-06 alle 18.55.37

o , come abbiamo detto all’inizio,

il tasso di risparmio moltiplicato per dell’utilità marginale del consumo deve essere sempre uguale alla felicità meno il tasso effettivo di utilità goduta.

Keynes, al quale sono grato per molti altri suggerimenti, mi ha mostrato che questo risultato può anche essere ottenuto mediante il seguente semplice ragionamento.

Supponiamo che in un anno dovessimo spendere £ x e risparmiare £ z .

Allora il vantaggio di acquistare da un extra di £ 1 spesa è u (x), l’utilità marginale del denaro, e questo deve essere uguale al sacrificio imposto risparmiando £ 1 in meno.

1 Il limite superiore non sarà ∞ , ma il minimo capitale con cui può essere ottenuta la felicità, se questo è finito. c aumenta costantemente con t, ad un certo tasso fino a che l’integrando svanisce , così che la trasformazione è ammissibile.

Risparmiare 1 £ in meno nell’anno significherà che risparmieremo solo £ z in 1 + 1 / z anni, non, come prima, in un anno. Di conseguenza, saremo in tempo 1 +1 / z anni esattamente dove avremmo dovuto essere nel tempo di un anno, e tutto l’andamento del nostro approccio alla felicità sarà posticipato di 1 / z anni, in modo che godremo 1 / z di un anno in meno di felicità e 1 / z anni di più al nostro attuale tasso.

Il sacrificio è, dunque,

Schermata 2014-01-06 alle 18.57.49

 

Uguagliandolo ad u ( x ), otteniamo di nuovo l’equazione ( 5 ), se sostituiamo z  con   Schermata 2014-01-06 alle 18.58.07     , il suo valore limite.

Purtroppo questo semplice ragionamento non può essere applicato quando prendiamo in considerazione l’attualizzazione, e pertanto ho mantenuto le mie equazioni ( 1) – ( 4) , che possono essere facilmente estese per affrontare i problemi più complessi.

La caratteristica più notevole della regola è che è del tutto indipendente dalla funzione di produzione f(a , c), tranne che nella misura in cui ciò determina la felicità, il tasso massimo di utilità ottenibile.

In particolare l’importo che dovremmo risparmiare di un determinato reddito è del tutto indipendente dall’attuale tasso di interesse, a meno che questo sia in realtà pari a zero. Il carattere paradossale di questo risultato risulterà in una certa misura mitigato più avanti, quando troviamo che se il futuro è scontato ad un tasso ρ costante e il tasso di interesse è costante e pari a r, la quota di reddito da risparmiare è una funzione del rapporto ρ / r . Se ρ = 0 tale rapporto è 0 ( a meno che anche r sia 0) e la percentuale da risparmiare è quindi indipendente da r.

Il tasso di risparmio che la regola impone è notevolmente superiore a quello che chiunque normalmente suggerirebbe, come si può vedere dalla tabella seguente, che viene presentata solo come un esempio.

Traduzione Schermata 2014-01-06 alle 18.58.28

Se trascuriamo le variazioni nella quantità di lavoro, l’importo che deve essere risparmiato su un reddito familiare di £ 500 sarebbe di circa £ 300. Perché allora la felicità meno tasso effettivo di utilità = 8-3 = 5 . Risparmio = £ 300 e l’utilità marginale del consumo di £ 200 = circa 1 / 60 £ . ( Da £ 150 a £ 300 U (x) = 13x/300 -3 – x2 / 15000, che corrisponde approssimativamente ad una parabola, così che u (x) = 13/300 – x/7500 = 1/60 se x = 200.)

Vale la pena soffermarsi un attimo a considerare quanto le nostre conclusioni sono influenzate dalle considerazioni che le nostre ipotesi semplificatrici ci hanno costretto a trascurare. Il probabile aumento della popolazione costituisce una ragione per risparmiare ancora di più, e così anche la possibilità che le invenzioni future metteranno il livello di felicità più in alto di quello che appare adatto al presente. D’altra parte, la probabilità che le invenzioni e i miglioramenti nell’organizzazione futuri sono atti a rendere gli introiti ottenibili con minor sacrificio di quello attuale è una ragione per risparmiare di meno. L’influenza delle invenzioni così opera in due modi opposti: ci fornisce nuovi bisogni che possiamo soddisfare meglio se abbiamo risparmiato in precedenza, ma anche aumenta la nostra capacità produttiva e rende il risparmio precedente meno pressante.

Il fattore più grave trascurato è la possibilità di future guerre e terremoti che distruggono le nostre accumulazioni. Questi non possono essere adeguatamente calcolati perché col determinare un tasso di interesse molto basso per lunghi periodi, dal momento che possono rendere il tasso di interesse effettivo negativo, distruggono come fanno non solo gli interessi, ma anche il capitale.

II

Propongo ora di considerare che il compenso del capitale e del lavoro siano costanti e indipendenti, 1 in modo che

f (a , c) = pa + rc

dove p, il tasso dei salari, e r, il tasso di interesse, sono costanti .

Questa ipotesi ci permetterà

(a) Di rappresentare la nostra precedente soluzione con un semplice diagramma ;

(b) Di estenderla al caso di un individuo che vive solo un tempo finito;

(c) Di estenderla per includere il problema in cui i futuri valori di utilità e di disutilità siano attualizzati ad un tasso costante.

1 Vale la pena notare che nella maggior parte di (a) si richiede solo l’indipendenza dei rendimenti, e non la costanza, e che in nessun luogo abbiamo davvero bisogno che i salari siano costanti, ma queste ipotesi sono fatte per semplificare del tutto la formulazione. Sono meno assurdi se lo stato è uno fra quelli che avanzano lentamente, in modo che i tassi di interesse e i salari sono in gran parte indipendenti da ciò che il nostro stato particolare risparmia e guadagna .

Nella nostra nuova ipotesi il reddito della comunità si divide in due parti ben definite, pa ed rc, che sarà conveniente chiamarle rispettivamente introito da guadagno e introito da rendita .

( a) L’equazione ( 2 ), che ora leggiamo

v (a) = pu( x )

determina a come funzione della sola x, e possiamo utilmente porre

y = x – pa = consumo – redditi da lavoro

w ( y) = u ( x ) = v ( a) / p

W ( y) = ∫ w (y) dy = ∫ (u (x) dx – v (a) da) = U (x) – V (a)

W ( y) può essere chiamata utilità totale e w (y) l’utilità marginale del reddito da capitale, dal momento che sono utilità totali e marginali derivanti dal possesso di una rendita y disponibile per il consumo.

L’equazione ( 5 ), ora ci dà

Traduzione Schermata 2014-01-06 alle 19.04.25

il che significa che il punto ( rc , B) si trova sulla tangente in y alla curva z = W (y) .

La figura ( 1 ) mostra la curva z = W ( y) , che raggiunge sia il valore B ad un valore y1 finito (il caso mostrato in figura) oppure vi si avvicina asintoticamente per y → ∞ .

Al fine di determinare la quantità di una data rendita rc che deve essere risparmiata, prendiamo il punto P, ( rc , B), sulla linea z = B, e da esso tiriamo una tangente alla curva (non z = B , che sarà sempre una tangente, ma l’un’altra) . Se l’ascissa di Q , il punto di contatto, è y, una quantità y della rendita verrebbe consumata, e il resto, rc – y, verrebbe risparmiata. Naturalmente y può essere negativa, il che significherebbe che non solo l’intera rendita sarà risparmiata, ma anche una parte del reddito da lavoro.

E ‘ facile vedere che ci deve essere sempre un tale tangente, perché la curva z = W (y) avrà una tangente o asintoto y = – η , dove η è il più grande eccesso di introiti rispetto al consumo compatibile con il mantenimento dell’esistenza.

Questa regola determina la quantità di un determinato reddito che dovrebbe essere spesa, ma non ci dice a quanto il nostro reddito ammonterà dopo un certo lasso di tempo . Questo è ottenuto dall’equazione ( 3 ) , che ora ci dà

Traduzione Schermata 2014-01-06 alle 19.06.03

Qui A = w (y0), dove y0 è il valore di y per t = 0 determinato come ascissa di Q , dove P è (rc0,B) .

Supponiamo, allora, che vogliamo trovare il tempo impiegato ad accumulare un capitale c da un capitale iniziale c0 , assumiamo che  P sia il punto ( rc , B ) e P0 sia ( rc0 , B ). w (y) è poi la pendenza della tangente da P, e w(y ) la pendenza della tangente da P0, in modo che nel momento in questione

Traduzione Schermata 2014-01-06 alle 19.07.18

 

Traduzione 2014-01-06 alle 19.11.04

( b) Supponiamo ora che ci occupiamo di un individuo che vive solo per un tempo determinato, diciamo T anni, invece di una comunità che vive per sempre. Abbiamo ancora l’equazione (4)

Traduzione Schermata 2014-01-06 alle 19.16.05

ma K non è più uguale a B , e deve ancora essere determinata.

Per trovarla dobbiamo sapere quanto capitale il nostro uomo sente necessario lasciare ai suoi eredi; chiamiamo questo c3.

L’equazione ( 8 ) indica, come prima che y può essere trovato come l’ascissa del punto di contatto Q di una tangente tirata da ( rc , K ) ovvero P alla curva. P si trova sempre su z = K , e la sua ascissa comincia da rc0 e finisce in rc3. K si può assumere come minore di B, poiché un uomo che vive solo un tempo finito risparmierà meno di chi vive un tempo infinito, e maggiore sarà K , maggiore sarà il tasso di risparmio. Di conseguenza, z = K incontrerà la curva , diciamo in P4.

Schermata 2014-01-06 alle 20.32.34

Da entrambi P0 e P3 ci saranno due tangenti alla curva, di cui o la superiore o quella inferiore può, per quanto ne sappiamo, essere presa come determinante y0 e y3 Se, tuttavia, c3 > c0 come in fig . 2, possiamo solo prendere la tangente inferiore da P0, perché la tangente superiore dà un valore di y0 maggiore di uno dei valori di y3 , che è impossibile, in quanto y aumenta in modo continuo. Prendendo, poi , Q0 come il punto di contatto della tangente inferiore da P0, ci sono due possibili casi, secondo se prendiamo  y3 come determinante o di Q3, il minore, o Q3‘, il valore superiore. Se prendiamo Q3, P0 porta direttamente a P3, e qui ci sarà sempre risparmio; questo accade quando T è piccolo. Ma se T è grande, Q0 porta direttamente a Q3‘, e P0 va in primo luogo a P4, e poi indietro a P3, all’inizio qui c’è il risparmio, e successivamente sperpero.

Allo stesso modo , se c0 > c3 , ci sono due possibili casi, e in questo caso è la tangente inferiore da P3 che non può essere presa .

Al fine di determinare quali tangenti prendere e anche il valore di K dobbiamo utilizzare la condizione derivata dall’equazione (7)

Traduzione Schermata 2014-01-06 alle 20.33.06

Questo , unitamente al fatto che le ascisse di P0 e P3 sono c0, c3, e che hanno la stessa ordinata K , è sufficiente a fissare sia K e le tangenti da adottare.

(c) Dobbiamo ora vedere come i nostri risultati devono essere modificati quando non riteniamo le future utilità e disutilità uguali a quelle attuali, ma le attualizziamo ad un tasso costante ρ.

Questo tasso di attualizzazione di vantaggi futuri deve, naturalmente, essere distinto dal tasso di attualizzazione di future somme di denaro.

Se posso prendere in prestito o dare  in prestito ad un tasso r devo necessariamente essere altrettanto soddisfatto con un extra di £ 1 ora e un extra  £ (1 + r) dopo un anno, dal momento che potrei scambiare l’ uno con l’altro. Il mio tasso marginale di sconto per il denaro è, dunque, necessariamente r, ma il mio tasso di sconto per l’utilità può essere molto diverso, dal momento che l’utilità marginale del denaro per me può variare per il mio aumentare o diminuire della spesa col passare del tempo .

Assumendo il tasso di sconto costante, non voglio dire che è lo stesso per tutti gli individui dal momento che attualmente ci occupiamo di un solo individuo o di una comunità, ma che il valore attuale di un godimento ad una qualche data futura deve essere ottenuto attualizzandolo al tasso ρ. Così, assumendo che sia circa 3/4 per cento, l’utilità in certo momento sarebbe considerata come due volte più desiderabile di quella di cento anni più tardi, quattro volte più preziosa che 200 anni più tardi, e così via ad un tasso di attualizzazione composto.

Questa è l’unica ipotesi che possiamo fare, senza contraddire la nostra ipotesi fondamentale che le generazioni successive sono mosse dallo stesso sistema di preferenze. Infatti, se avessimo avuto un tasso variabile di attualizzazione – vale a dire dire uno più alto per i primi 50 anni – la nostra preferenza per godimenti nel 2000 d.C. rispetto a quelli del 2050 d.C. verrebbero calcolati al tasso più basso, ma quello delle persone vive nel 2000 d.C. sarebbe al valore più alto.

Supponiamo in primo luogo che il tasso di sconto per l’utilità ρ sia inferiore al tasso di interesse r.

Allora le equazioni (1) e (2) sono invariate, ma l’equazione (3) diventa

Schermata 2014-01-06 alle 20.36.05

se stiamo assumendo   Schermata 2014-01-06 alle 20.36.18       costante e uguale a r;

Traduzione Schermata 2014-01-06 alle 20.36.55

Questa equazione è la stessa della (8) tranne che invece di w(y) e W(y), che è ∫ w(y) dy, abbiamo wr / (r – ρ )(y) e  ∫ w r / (r – ρ )(y) dy.

Il metodo di soluzione sia per una comunità sia per un individuo è dunque lo stesso di prima, tranne che al posto dell’effettiva utilità della rendita da capitale dobbiamo considerare che possiamo affermare la sua utilità modificata, ottenuta integrando l’utilità marginale alla potenza r/(r-ρ). Questo ha l’ effetto di accelerare la diminuzione dell’utilità marginale e di diminuire l’importanza relativa di alti redditi. In questo modo possiamo tradurre la nostra attualizzazione del futuro in una attualizzazione di alti redditi. La velocità con cui questo viene fatto è disciplinata esclusivamente dal rapporto ρ su r, in modo che se ρ è 0, esso è indipendente dal valore di r, purché questo non sia 0. La conclusione principale della sezione I viene così confermata.

Vi è, tuttavia , una piccola difficoltà, perché non abbiamo ancora veramente dimostrato che se consideriamo un tempo infinito, la costante K deve essere interpretata come quella che si potrebbe chiamare “felicità modificata”, vale a dire il valore massimo di Schermata 2014-01-06 alle 20.42.01

Questa felicità modificata richiederebbe lo stesso reddito come per la felicità, essendo la modifica esclusivamente nel valore impostato su di essa. Questo risultato può tuttavia essere dedotto immediatamente dall’equazione ( 9a ), che dimostra che y aumenta fino a che si

raggiunge la felicità, così che  Schermata 2014-01-06 alle 18.58.07        non possa mai diventare negativa e K non può essere inferiore alla felicità modificata. D’altra parte, purché questa condizione sia soddisfatta, la 9 (a) mostra che più grande è la y inizialmente, più piccola sarà la A,  più grande sarà y nel tempo futuro. Quindi K deve essere la più piccola possibile (purché non sia così piccola da rendere Schermata 2014-01-06 alle 18.58.07             in fine negativa) ; in modo che K non può essere maggiore della felicità modificata. Quindi se non è né inferiore né maggiore  deve essere uguale.

Come in (b), si può adattare la nostra soluzione al caso di un individuo con solo un tempo finito di vita, così in questo caso disegnerò le tangenti alla curva di utilità modificata.

Un caso particolare interessante è quella di una comunità per la quale

Traduzione Schermata 2014-01-06 alle 20.42.50

E’ chiaro che corrisponde a K = B nel caso in cui ρ = 0

abbiamo qui K = K1

e il risparmio  Schermata 2014-01-06 alle 20.44.46ovvero, una percentuale costante Schermata 2014-01-06 alle 20.44.57     della rendita da capitale deve essere risparmiata, che se ρ = 0 sarà   Schermata 2014-01-06 alle 20.45.13                   e indipendente da r.

Se il tasso di interesse è inferiore al tasso di attualizzazione dell’utilità, avremo equazioni simili, che portano ad un risultato molto diverso. L’utilità marginale del consumo aumenterà ad un tasso ρ –  r, e il consumo scenderà verso il livello più basso di sussistenza per il quale la sua utilità marginale può essere presa come infinita, se trascuriamo la possibilità del suicidio. Durante questo processo tutto il capitale verrà consumato e i debiti contratti si estenderanno a quelli da cui sono stati ottenuti, l’ipotesi più semplice a questo punto è che sarà possibile prendere in prestito una somma tale che è solo possibile per restare in vita dopo aver pagato gli interessi su di essa.

III

Consideriamo ora il problema della determinazione del tasso di interesse .

(α) In primo luogo, supponiamo che tutti attualizzano l’utilità futura per sé o per i propri eredi, allo stesso tasso ρ.

Allora in uno stato di equilibrio non ci sarà alcun risparmio e

Traduzione Schermata 2014-01-06 alle 20.45.38

tre equazioni per determinare x , a e c .

L’ ultima equazione ci dice che il tasso di interesse come determinato dalla produttività marginale del capitale   Schermata 2014-01-06 alle 20.36.18            , deve essere uguale al tasso di attualizzazione ρ.1

Ma supponiamo che in un dato momento, diciamo quello presente,  Schermata 2014-01-06 alle 20.36.18         > ρ.

Allora non ci sarà equilibrio, ma il risparmio, e poiché una grande quantità non può essere risparmiata in un breve periodo di tempo, potrebbe volerci secoli prima che l’equilibrio sia raggiunto, o può non essere mai raggiunto, ma solo approssimato asintoticamente; e si pone la questione di come, nel frattempo, il tasso di interesse viene determinato, poiché non può esserlo dall’equazione ordinaria di equilibrio della domanda e dell’offerta .

La difficoltà è che il tasso di interesse non funziona come richiesta di prezzo per un intera quantità di capitale, ma come un prezzo di fornitura, non per una quantità di capitale, ma per un tasso di risparmio. Lo stato risultante della situazione è rappresentata in fig. 3, in cui, tuttavia, variazioni della quantità di lavoro sono trascurate. Questo mostra la curva di domanda per il capitale r =Schermata 2014-01-06 alle 20.36.18    , la curva definitiva di offerta r = ρ e la curva temporanea di offerta c = c0 .

È chiaro che il tasso di interesse è determinato direttamente dalla intersezione della curva di domanda con le temporanea curva di offerta c = c0. La curva definitiva di offerta r = ρ entra in gioco solo in quanto disciplina il tasso al quale c0 approssima il suo valore definitivo OM , un tasso che dipende approssimativamente dal rapporto di PM su QN. Vediamo, dunque , che il tasso di interesse è disciplinato principalmente dal prezzo di domanda, e può superare di gran lunga la ricompensa definitiva necessaria per indurre l’astinenza.

1 L’ equilibrio potrebbe, tuttavia, essere ottenuto o alla felicità  con ρ < Schermata 2014-01-06 alle 20.36.18      , o al livello di sussistenza con  ρ >  Schermata 2014-01-06 alle 20.36.18  . Cfr. ( γ ) di seguito .

Allo stesso modo, nella contabilità di uno Stato Socialista la funzione del tasso di interesse garantirebbe l’uso più saggio del capitale esistente, non servirebbe in alcun modo diretto come guida per la quota di reddito che deve essere risparmiata.

(β) Ora dobbiamo cercare di tenere un po’ in conto il fatto che persone diverse attualizzano l’utilità futura a tassi differenti, e, a parte il fattore tempo, non sono abbastanza interessati ai loro eredi come in loro stessi.

Supponiamo che non siano interessati affatto ai loro eredi;

Schermata 2014-01-06 alle 20.48.25

che ad ogni uomo è imposta una quota del mantenimento di quei bambini che sono necessari per mantenere in esistenza la popolazione, ma inizia la sua vita lavorativa, senza alcun capitale e si conclude senza alcuno, dopo aver speso i suoi risparmi in una annualità; che all’interno della sua propria vita ha un programma di utilità costante per il consumo e l’attualizzazione di utile futuro ad un tasso costante, ma che questo tasso si può supporre diverso per persone diverse.

Quando tale comunità è in equilibrio , il tasso di interesse deve, ovviamente0, essere uguale al prezzo di offerta di capitale  Schermata 2014-01-06 alle 20.36.18       . E sarà anche uguale al ” prezzo di fornitura “che nasce nel seguente modo.

Supponiamo che il tasso di interesse sia costante e pari a r, e che il tasso di attualizzazione di un determinato individuo sia ρ. Allora, se r > ρ, egli risparmierà quando è giovane, non solo per provvedere per la perdita della capacità di guadagno in età avanzata, ma anche perché può ottenere più sterline da spendere in un secondo momento rispetto a quelle che rinuncia a spendere ora. Se trascuriamo le variazioni nella sua capacità di guadagno, la sua azione può essere calcolata modificando le equazioni IIc applicandole ad una vita definita come in IIb. Egli accumulerà per un periodo il capitale, e quindi lo spenderà prima di morire. A parte quest’uomo, dobbiamo supporre che ci siano nelle nostre comunità altri uomini, esattamente come lui, tranne che per essere nati in tempi diversi. Il capitale totale posseduto da n uomini di questo tipo le cui date di nascita sono distribuite uniformemente per tutto il periodo di una vita sarà n volte il capitale medio posseduto da ciascuno nel corso della sua vita. La classe degli uomini di questo tipo possederà, dunque, un capitale costante a seconda del tasso di interesse, e questo sarà l’importo del capitale da essi fornito a quel prezzo. (Se ρ > r, potrebbe essere negativo, in quanto potrebberoro prendere in prestito da giovani e rimborsare da vecchi.) Possiamo quindi ottenere la curva di offerta totale del capitale sommando le forniture ad un determinato prezzo per ciascuna classe dei singoli individui.

Se, poi, si trascura l’interesse degli uomini nei loro eredi, vediamo che il capitale ha un prezzo di cessione determinato per essere equiparato al suo prezzo di domanda. Questo prezzo di offerta dipende da tassi di attualizzazione delle persone per l’utilità, e può essere equiparato al tasso di attualizzazione del “risparmiatore marginale”, con il significato di qualcuno il cui tasso di attualizzazione è pari al tasso di interesse che né risparmia né prende a prestito (salvo per provvedere  alla vecchiaia ) .

Ma la situazione è diversa dal problema di fornitura ordinaria, in questo che quelli oltre questo “margine ” non forniscono semplicemente nulla, ma determinano una prestazione negativa prendendo in prestito quando sono giovani contro i loro guadagni futuri, ed essendo mediamente in debito.

(γ) Ora torniamo al caso (α) immaginando uomini, o piuttosto famiglie, che vivono per sempre, e il tasso di attualizzazione dell’utilità futura costante, ma cerchiamo questa volta di tener conto delle variazioni del tasso di attualizzazione da famiglia a famiglia.

Per semplicità supponiamo che la quantità di lavoro è costante, in modo che il reddito totale del paese può essere considerato come una funzione f(c), del solo capitale. Il tasso di interesse sarà allora f”(c). Supponiamo anche che ogni individuo possa raggiungere la massima utilità concepibile con un reddito x1 finito, e che nessuno potrebbe sostenersi in vita con meno di x2.

Ora supponiamo che l’equilibriosi ottenga con un capitale c, reddito f(c), e un tasso di interesse f'(c) o r. Allora queste famiglie, diciamo in numero di m(r), il cui tasso di attualizzazione è inferiore a r devono aver raggiunto la felicità o starebbero ancora aumentando la loro spesa secondo l’equazione (9a). Di conseguenza, esse avranno tra loro un reddito m (r).x1. Le altre famiglie, in numero n – m (r) (dove n è il numero totale delle famiglie), devono essere al livello di sussistenza, o starebbero ancora diminuendo le loro spese. Di conseguenza queste avrebbero tra loro  un reddito complessivo { n – m(r)} x2,

Traduzione Schermata 2014-01-06 alle 20.49.46

che, insieme con r = f ‘( c ), determina r e c.  Essendo m (r) una funzione crescente di r, è facile vedere, disegnando i grafici di r in funzione di f ( c ), che le due equazioni hanno in generale una unica soluzione unica 2.

In tal caso, quindi, l’equilibrio sarebbe raggiunto da una divisione della società in due classi, la classe parsimoniosa che gode della felicità e una improvvida al livello di sussistenza.

F.P. Ramsey

King’s College , Cambridge.

1 Si è supposta ogni famiglia in equilibrio, che è l’unico modo in cui questo stato può essere mantenuto,dal momento che altrimenti, sebbene i risparmi di alcuni bilancerebbero in ogni istante i prestiti degli altri, non continuerebbero a farlo se non per un fatto straordinario.

2 Abbiamo trascurato in questo il numero trascurabile di famiglie per cui ρ è esattamente uguale a r.

Note on Communication

27 Set

Frank_Plumpton_RamseyRiporto la mia traduzione di un appunto dattiloscritto di Frank Ramsey conservato presso gli archivi del  Dipartimento della Filosofia Scientifica dell’Università di Pittsburg  nella raccolta FR 007-03-02 (box 7, folder 3)

Si tratta di una riflessione che riguarda la comunicazione ed il significato. Deriva sia da una analisi delle posizioni in merito sia di Russell nel suo articolo pubblicato su Monist nel 1914 Sulla Natura della conoscenza – Descrizione preliminare dell’esperienza, sia dalla lettura del Tractatus di Ludwig Wittgenstein.

Questa è la traduzione.

A. Nota sulla comunicazione

Se le parole simboleggiano i pensieri,

le mie parole devono simboleggiare i miei pensieri

cioè , le parole sono private

ovvero, il mio uso di “tavolo” simbolizza il mio dato sensoriale di un tavolo

Ma se il mio uso di ” tavolo” può essere compreso – cioè può causare a qualcun altro di pensare ad un tavolo [Questo deduco dalle loro risposte e comportamento, che conosco attraverso i miei dati sensoriali.] la parola (simbolo) ” tavolo” deve essere in un certo senso pubblica .

I miei dati sensoriali sono certamente privati vale a dire che ​​non sono di chiunque altro.

Così che la comunicazione presuppone che i dati sensoriali siano insieme di persone e di cose.

Le relazioni di comunicazione sono quindi

Schermata 2014-09-27 alle 17.16.06

simbolo – pensiero – dati sensoriali – oggetto

Cioè, in una comunicazione corretta deve essere simbolizzata la stessa cosa, gli stessi dati sensoriali non possono esserlo.

Questo è il testo originale:

A. Note on Communication

If words symbolize thoughts,

my own words must symbolize my own thoughts

that is, words are private

or, my use of “table” simbolizes my sense-data of a table

But if my use of “table” can be understood – i.e. can cause someone else to think of a table

[This I infer from their answers and behaviour, which I know through my sense-data.] the word (symbol) “table” must be in some sense public.

My sense date are certainly private i.e. are not anyone else’s.

So that communication supposes both persons and things that sense-data are of.

The relations in communication are thus

Schermata 2014-09-27 alle 17.17.16

symbol- thought – sense-data – thing

That is, in correct communication the same thing must be symbolized, the same sense-data cannot be.

THE DOUGLAS PROPOSALS

26 Set

Ramsey_2Riporto la mia traduzione di un interessante articolo di economia di Frank Ramsey il cui testo originale si trova negli Archivi del Dipartimento di Filosofia Scientifica Collezione Speciale dell’Università di Pittsburg (al Box n.7, folder 3 parte 1)

Si tratta della contestazione di una teoria economica, con purtroppo ancora dei seguaci, che si basa su un errore di logica non facilmente determinabile se non attraverso un corretto ragionamento partendo da casi semplici e con un sistema di analisi più complesso per contenere tutti i casi possibili.

Clifford Hugh Douglas (1879 -1952) sosteneva (L’illusione della Super – Produzione dell’anno 1918, Democrazia economica – Il credito e la democrazia dell’anno 1920)  che la somma di stipendi, salari e dividendi sono inferiori ai prezzi dei beni e servizi prodotti settimanalmente e pertanto i lavoratori non possono avere denaro sufficiente ad acquistare i beni ed i servizi prodotti. Ne conclude che il sistema della contabilità rende tecnicamente impossibile la consegna di merci e servizi e quindi il sistema è costruito per massimizzare i profitti di chi ha il potere economico (questo forse è vero, ma per altri e più banali motivi) e realizzare un’inutile scarsità. Il ragionamento appare, a prima vista plausibile, ma è errato nella maggior parte dei casi come dimostra Ramsey.

Questo saggio rivela il brillante ingegno matematico di Frank Ramsey e la sua capacità di operare in ambiti logici diversissimi. Secondo quanto riportato da Keynes gli economisti si recavano da lui per avere conferma o contestazione delle loro elaborazioni oppure per tradurre in formule le loro valutazioni.

Credo che questo genio ci manchi molto nella situazione attuale.

Vorrei notare come nelle sue dimostrazioni sia molto chiaro l’ambito di applicabilità ed i limiti delle teorie che espone. Purtroppo è una qualità che manca a molti attuali economisti che operano, spesso con effetti catastrofici, con teorie molto matematiche e poco coerenti con le condizioni al contorno o quelle della realtà. Per non parlare di chi usa formule matematiche di terzi senza sapere dove si possono applicare e le applica a sproposito in situazioni che nulla hanno a vedere con l’analisi che si vuole fare.

Quindi c’è da sperare che anche le formule esposte in questo articolo non vengano prese ed usate a sproposito.

Questa è la traduzione.

I CONCETTI PROPOSTI DA  DOUGLAS

A chi è interessato ai concetti proposti da Douglas raccomanderei di studiare Dividendi per tutti, di W. Allen Young, un libretto da sei penny in possesso di evidenti vantaggi sia in termini di brevità e chiarezza rispetto all’esposizione del Maggiore Douglas stesso che è sempre oscuro e spesso assurdo. Le affermazioni più importanti si possono trovare nelle pag. 13 e 20.

(1) ” Si sostiene che i salari, gli stipendi e i dividendi emessi in qualsiasi periodo unitario di tempo non sono mai sufficienti ad acquistare i prodotti finali immessi per la vendita durante lo stesso periodo. ”

(2) “Un nuovo fondamento per i prezzi. – I beni di uso finale (ad esempio il carbone per uso domestico) saranno venduti a meno del loro costo, alla stessa frazione del costo (che è quello che include tutti i dividendi e utili) come il Consumo Totale di tutte le Merci sostiene  la Totale Produzione di Credito Effettivo durante uno specifico periodo di tempo. Con questo metodo, i prezzi attuali sarebbero ridotti a circa un quarto del costo totale ……..

“il Governo rimborserà ai proprietari (ad esempio, i proprietari di miniera di carbone) la differenza tra il costo complessivo sostenuto, e il loro prezzo totale ricevuto, per mezzo di buoni del Tesoro, tali buoni verrebbero addebitati come avviene adesso sul conto del Debito Nazionale.”

A favore di (1) Young afferma: “ll prezzo è quindi costituito da due grandi somme erogate dal Produttore: (A) Tutte le somme versate per le materie prime e spese generali, e (B) tutti gli importi versati in salari, stipendi e dividendi. Quindi il prezzo è uguale a (A) più (B). Ma il denaro pagato come(B) è tutto il denaro che al consumatore di questo paese è dato per comprare le merci che lui stesso aiuta a produrre con la propria attività manuale, con il cervello o con il capitale ….. Pertanto, (B), la quantità di denaro totale emessa, non sarà mai sufficiente a comprare tutte le merci il cui prezzo è (A) più (B). ”

Quindi afferma “È stato sostenuto dagli oppositori a questo schema che di nove fabbriche che forniscono prodotti finali per il consumo questo può essere vero; ma che nello stesso periodo di tempo una decima fabbrica produrrà merci intermedie che non rientrano nel mercato al consumo, ma in relazione alle quali vengono emessi i salari, gli stipendi e dividendi  che possono assorbire l’eccedenza dagli altri nove.” Oltre alla precisione o meno del rapporto di nove a uno, questo argomento è molto semplice e sembra mostrare una vera e propria falla nel ragionamento di Douglas, in modo che è fondamentale esaminare attentamente ciò che Young dice in risposta ad esso. La sua risposta è triplice : –

“(a) La moneta emessa dalla decima fabbrica non poggia su una relazione matematica definita rispetto al valore del prezzo dei beni di consumo finali immessi sul mercato dalle altre nove fabbriche, e non sarebbe sufficiente a bilanciarli se i relativi prezzi rimangono stabili.”

Ma mentre questo non gli sta bene esiste una relazione matematica precisa, dal momento che egli stima che il deficit totale di potere d’acquisto pari a 1 : 4. E in ogni caso l’affermazione che il denaro può o non può essere sufficiente non può essere considerata come una prova che non sia sufficiente.

” (b) Ma i loro prezzi non rimangono costanti. I grossisti e i dettaglianti, quando il denaro della decima fabbrica entra nel mercato, trovano che la domanda è salita senza che la produzione sia cresciuta. Essi quindi aumentano i prezzi. In altre parole, l’effetto del denaro introdotto dalla decima fabbrica non è di eliminare l’eccedenza di tutte le merci in eccedenza delle altre nove, ma solo di eliminare qualcuna di queste, fino a che un aumento dei prezzi bilanci la nuova moneta introdotta nel mercato. Così i prezzi crescono per chi ricava denaro dalle altre nove fabbriche, che rende ancora più impossibile per questi (che ricava denaro dalle altre nove fabbriche) di acquistare tutti i beni di prodotti finali, se lo volessero fare.”

Questo argomento fallisce lo scopo; quello che viene suggerito, in risposta alla tesi di Douglas è che nello stesso periodo di tempo altre fabbriche produrrebbero merci non per il consumo immediato e che i salari e i dividendi versati da quelle fabbriche potrebbero costituire una distribuzione di potere d’acquisto sufficiente a consentire che il surplus venga acquistato . Come è evidente, i salari dei lavoratori che producono prodotti intermedi, come il carbone per uso industriale, sono un fattore sempre presente nella domanda di beni di consumo; non ha senso parlare di un aumento dei prezzi quando questi salari entrano nel mercato.

Ma anche se non fallisse lo scopo, l’asserzione non è plausibile . Ex hipotesi è impossibile vendere, anche al costo, una gran parte dei beni di consumo prodotta. Se poi ci fosse qualche concorrenza, è poco probabile che i prezzi saliranno al di sopra dei costi in qualche misura apprezzabile.

” (c) Anche nel periodo successivo di tempo i costi totali della decima fabbrica entrano nei prezzi dei beni finali prodotti dalle altre nove “. (Certamente.) ” Così la velocità del flusso del potere di acquisto è sempre minore della velocità di flusso dei prezzi. “Questo è ciò che sta cercando di dimostrare, e chiaramente non consegue dall’osservazione precedente. Questo argomento è una mera affermazione del punto da provare.

Usiamo “prezzo di costo ” per includere il conservare il capitale, ma non il costo per aumentarlo, questo è ovviamente il corretto utilizzo, ed è, penso quello di Douglas e dei suoi seguaci. Abbiamo visto che non sono stati avanzati motivi da Douglas per pensare che il rapporto, che il prezzo di vendita deve dare rispetto al prezzo di costo se il potere d’acquisto distribuito è in grado di acquistare tutti i beni di consumo prodotti, sia inferiore all’unità. Ma questo può, tuttavia, essere il caso.

Vi è, tuttavia, un argomento forte e semplice per supporre che il rapporto non differisca sensibilmente dall’unità. Perché è facile vedere che in uno stato stazionario, cioè quello in cui la produzione va avanti a un ritmo immutabile e i prezzi, i salari e la ricchezza nazionale non cambiano mai, il rapporto sarebbe l’unità. Perché in un tale stato il tasso di flusso del costo dei beni di consumo prodotti è A + B con la notazione introdotta qui sopra, dove A , B vengono sommati per tutte le fabbriche che producono beni di consumo. Il potere d’acquisto è distribuito da queste fabbriche in ragione di B. Ma il tasso degli altri pagamenti A essendo fatto da queste fabbriche, rappresenta i pagamenti dei dividendi e dei salari fatte in un momento precedente da altre fabbriche che producono prodotti intermedi. Pertanto, nell’ipotesi di produzione immutabile , la distribuzione del potere d’acquisto da tutte queste altre fabbriche procede al tasso A. In modo che il tasso globale di distribuzione o potere d’acquisto è A + B, che equivale al tasso di flusso del prezzo di costo dei beni di consumo. Poiché il rapporto è l’unità per uno stato stazionario, è improbabile che allo stato attuale differisca notevolmente dall’unità, perché lo stato attuale non è molto lontano dall’essere stazionario.

Ma è possibile utilizzando alcune complicate operazioni matematiche dimostrare che il rapporto è l’unità sotto condizioni molto più ampie, che consentono di tenere conto di variazioni della quantità di produzione, del tasso dei salari, della produttività del lavoro, della ricchezza nazionale. La prova di questo è riportata di seguito, ma saranno in grado di seguirla solo quelli  che hanno familiarità con l’integrazione per parti.

Partiamo dal presupposto che tutto il lavoro è esprimibile in termini di unità o di lavoro . Che i risultati del lavoro sono merci, non necessariamente prodotti finiti, ma può darsi miglioramento di  merci e, in ogni caso esprimibile in termini di unità che dobbiamo chiamare, in mancanza di meglio, unità di merce. La nozione di merce comporta la nozione di utilità, in modo che le merci meno utili conterrebbero meno unità di merce. Chiameremo la produttività del lavoro in un dato momento il numero di unità di merci derivanti da una unità di lavoro ad un certo istante. La produttività per esempio si ridurrebbe se terreni meno fertili vengono messi in coltivazione, e aumenterebbe se la produzione fosse organizzata in modo più efficiente.

Sia T l’istante di tempo considerato.

Siano W(T) i salari pagati per unità di lavoro all’istante T.

Sia P (T) la produttività del lavoro all’istante T.

Quindi il numero di unità di lavoro necessari per produrre un’unità di merce è 1 / P ( T ), e il suo costo è W (T) / P (T).

Il tasso al quale vengono aggiunte unità di merce al tempo T ai beni che saranno effettivamente completi e  disponibili per il consumo al tempo t successivo sarà chiaramente funzione sia di T sia di t. Dobbiamo porre alcune ipotesi circa la forma di questa funzione, e l’unica che sembra condurre ad un’analisi funzionale è che la funzione in questione è il prodotto di una funzione di T e una funzione di t: vale a dire, che le proporzioni in cui al tempo T il lavoro viene speso per beni che saranno disponibili per il consumo a diversi intervalli di tempo è indipendente da T. (Questa ipotesi potrebbe essere incompatibile con le  fluttuazioni industriali e quindi implicare una semplificazione o valutazioni sulla media dei processi). Indichiamo questo prodotto con F (T) f (t). Quindi i salari pagati in ragione di unità di merce aggiunta al tempo T ai beni che saranno effettivamente pronti per il consumo al successivo tempo t  saranno F (T) f (t) W (T) / P (T) , e noi proponiamo di abbreviare e scrivere B (T) f (t).

Assumiamo un tasso costante continuo di interesse r, in modo che se z è la quantità di capitale C dopo il tempo t abbiamo dz / dt = rz, che fornisce z = Cert; e questo è anche il costo sostenuto in qualsiasi momento dopo aver speso C al tempo t in precedenza.

Per motivi pratici, è lecito ritenere che il periodo massimo tra l’inizio del lavoro su un bene e il suo completamento non superi una certa quantità finita t0.

Possiamo ora definire il capitale nazionale in possesso di chi controlla l’industria in qualsiasi momento pari alle merci incomplete accumulate al prezzo di costo (comprensivo di interessi), e supponiamo che un equivalente esatto in titoli ed azioni sia stato distribuito al pubblico a cui i controllori pagano interessi al tasso r, e che la variazione di questo capitale sia sempre accompagnata da un pari ammontare di nuovi prestiti da parte del pubblico o dal rimborso di tali prestiti.

La velocità di flusso dei prezzi di costo dei beni che diventano disponibili per il consumo al tempo T è

Schermata 2014-01-04 alle 21.04.05

perché il prodotto B (T – t ) f ( t ) rappresenta i salari pagati al tempo T – t in conto dei beni che diventano disponibili al successivo tempo t, cioè al tempo T, e il fattore di ert è inserito al fine di ottenere il costo effettivo sostenuto quando l’interesse viene preso in considerazione . Allo stesso modo la velocità con cui i salari vengono pagati al tempo T è

Schermata 2014-01-04 alle 21.16.04

Anche il capitale nazionale al tempo T come definito sopra è

Schermata 2014-01-04 alle 21.16.49

Perché B (T-u) f ( t) dt rappresenta i salari pagati al momento T-u in conto dei beni che si renderanno disponibili fra il tempo t e il successivo t + dt; e stiamo considerando solo i beni che sono incomplete al tempo T, vale a dire, al tempo u successivo a T-u , dobbiamo integrare dal valore minimo di t ovvero u , al valore massimo t0 , così che

Schermata 2014-01-05 alle 15.35.14

rappresenta i salari pagati al momento T-u per tutti i beni che risulteranno incompleti al tempo T; il fattore e si inserisce come prima, al fine di tener conto degli interessi.

I dividendi essendo versati al pubblico in qualche istante di tempo ammonteranno a r volte il capitale nazionale.

Il tasso al quale vengono costituiti nuovi prestiti da parte del pubblico è il coefficiente differenziale con riferimento al momento del capitale nazionale, vale a dire dC (T) / dt .

Supponiamo ora che x (T) sia il rapporto che abbiamo cercato di trovare, cioè il rapporto che i prezzi di vendita dei beni di consumo dovrebbero avere sui prezzi di costo al tempo T in modo che non ci sarebbe né un accumulo di beni di consumo invendibili né di potere d’acquisto invendibile nelle mani del pubblico. Quindi uguagliamo il tasso totale a cui il pubblico riceve il potere d’acquisto in forma di salari e dividendi con i prezzi d’acquisto delle merci risultanti disponibili per il consumo ed il tasso a cui il pubblico costituisce nuovi investimenti, quindi abbiamo

Schermata 2014-01-05 alle 15.59.18

Mostreremo ora che questa equazione può essere soddisfatta solo se x (T) = 1 .

Perché, integrando per parti il coefficiente di x ( T ) e assumendo che B ( T ) sia continua e derivabile, abbiamo

Schermata 2014-01-05 alle 15.59.37

e un confronto di questa equazione con l’ultima mostra che x (T ) = 1 .

Abbiamo ottenuto questo risultato imponendo determinate condizioni, ed è interessante vedere come il risultato è influenzato dalle variazioni di condizioni. La prima condizione che, nel calcolo dei costi, l’interesse è preso ad un tasso fisso r, non possiamo farne a meno; ma in condizioni modificate potremmo ammettere un tasso variabile di interesse sugli investimenti calcolando i dividendi al tasso r su un capitale nominale. L’altra condizione stabilita era l’uguaglianza del capitale nominale con il capitale nazionale come definito, e che le variazioni di questo siano  sempre accompagnate da nuovi investimenti o dal rimborso di investimenti . Passiamo fare a meno di queste condizioni e chiamare Q (T) il capitale nominale al tempo T e supponiamo che L (T), che definiamo come il tasso (positivo o negativo) a cui il pubblico investe il denaro, non sia necessariamente uguale a dQ (T) / dt . Quindi l’equazione per x ( T ) diventa

Schermata 2014-01-05 alle 16.22.50

Abbiamo visto che se sostituiamo C (T) con Q (T) e dC (T) / dT con L (T) allora x (T) = 1 . Ne segue che x (T) è maggiore o inferiore all’unità , a seconda se

rQ (T) – L T) > oppure < rC (T) – dC (T) / dt ,

o se

r { Q (T) – C (T) } > oppure < L (T) – dC (T) dT .

Possiamo riassumere i principali casi in cui x (T) < 1 , come segue : –

(1) Supponiamo che L (T)= dQ (T) / dt , cioè , l’aumento del capitale nominale sia accompagnato da nuovi uguali investimenti; allora x (T) < 1 se dZ (T) / dt > rZ (T) , dove Z ( T) è uguale a (Q(T) – C(T) ), e può essere chiamata la capitale fittizio .

Quindi;

(a) Z ( T ) > 0, ( cioè , lo stato è sovracapitalizzato) – in questo caso il tasso di aumento di capitale fittizio deve superare il tasso di interesse; una situazione che non può essere mantenuta a lungo, così questo caso non è importante

Oppure ( b) Z (T) < 0 , cioè , le stato è sottocapitalizzato – in questo caso x (T) < 1, a meno che il tasso percentuale di aumento della sottocapitalizzazione superiore al tasso di interesse (ad esempio, uno stato socialista non paga alcun interesse, ma calcolandolo come un elemento di costo venderebbe chiaramente sotto costo).

(2) Supponendo che Q (T) = C (T), cioè, non vi è capitale fittizio, allora x (T) < 1 se L (T) > dC(T) / dT cioè , > dQ (T) / dT . Questo potrebbe solo normalmente accadere se nuovi investimenti portassero interessi ad un tasso s (poniamo ) < r, tasso a cui l’interesse è stimato in termini di costo. In questo caso l’ipotesi Q (T) = C (T) significa che il tasso di nuovi investimenti da’ al tasso di incremento del capitale nazionale il rapporto r : s.

Così che le uniche circostanze importanti alle quali dobbiamo vendere sotto costo, vale a dire 1(b), quando i dividendi vengono pagati meno del capitale nazionale; e la (2) quando il tasso di interesse sui nuovi investimenti è inferiore a quello in cui l’interesse è calcolato come un elemento di costo, sono come sarebbe ovvio per il senso comune ed è chiaramente irrilevante la tesi del Maggiore Douglas che “giusto prezzo” è oggi un quarto del prezzo di costo.

F.P. Ramsey

ON THE NATURE OF ACQUAINTANCE. – PRELIMINARY DESCRIPTION OF EXPERIENCE.

24 Set

Greuze La brocca rottaRiporto di seguito la mia traduzione di un articolo di Bertrand Russell pubblicato su MInd nel 1914 riguardante alcuni concetti basilari della teoria della conoscenza. Il testo originale è stato tratto dal sito dall’Hegler Institute  al link http://www.jstor.org/stable/27900472 .

L’interesse per questo testo, per altro incompleto di quelle parti seriamente contestate nei colloqui privati da Ludwig Wittgenstein, è essenzialmente legato alle elaborazioni della teoria della conoscenza dello stesso Wittgenstein e di Frank Plumpton Ramsey. Pertanto dobbiamo dire che queste elaborazioni sono state la base di uno sviluppo vigoroso della filosofia della conoscenza con importanti riflessi sulla scienza come, ad esempio, tutta la teoria della probabilità per le valutazioni in condizioni di incertezza; per non parlare dei riflessi sulla matematizzazione della scienza economica con conseguenze, tuttavia, spesso negative. Ciò non per errori degli ingegneri della conoscenza, ma piuttosto per l’uso di modelli inapplicabili a casi reali o generalizzazioni di fenomeni microscopici a quelli macroscopici. Infatti molti errori sono riconducibili all’aver usato formule di cui non si sapeva cosa significassero inserendo i parametri di un caso attuale. Questa procedura, che si applica spesso anche nell’ingegneria ordinaria, può essere accettata solo se si hanno dei riferimenti per controllare che i risultati non siano fuori di certi limiti che la logica imporrebbe. Viceversa siamo giunti all’adorazione delle formule matematiche dell’economia la cui contestazione è considerata blasfemia qualsiasi sia il risultato pratico a cui portino. Manca, cioè, la valutazione critica del risultato nell’ambito del modello di studio. E’ un errore frequente in molti campi del lavoro intellettuale. Faccio un banale esempio capitato a me in un periodo non recente.

Dovendo mettere in una casa di campagna, non abitata se non saltuariamente, in zona molto fredda in inverno un impianto capace di un riscaldamento molto veloce optai per un impianto ad acqua calda a termoconvettori. Questi apparecchi hanno un dimensionamento basato sul calcolo estivo e quindi lo scambiatore è calcolato per un salto termico molto piccolo. Nel sistema invernale il salto termico è molto alto e può superare, a regime, anche  di molto i 10 gradi. Quindi se l’impianto è squilibrato il termoconvettore meglio servito si prende tutto il calore e lascia gli altri freddi. Pertanto occorre realizzare un impianto perfettamente equilibrato ed è sconsigliabile usare valvole di regolazione dei flussi. L’idraulico che doveva fare l’impianto iniziò il lavoro mentre non ero presente senza chiedermi come doveva operare. Anzi si fece fare i calcoli dell’impianto da un ingegnere che glielo fece assumendo che termoconvettori o radiatori fossero la stessa cosa. Quando arrivai in cantiere e vidi dei tubicini di rame che facevano giri strani dissi all’idraulico:

  • Smonta tutto perché quest’impianto non funziona.

Rispose:

  • Ma i calcoli li ha fatti un ingegnere esperto di impianti termici.

Gli replicai:

  • Quest’impianto è squilibrato e i termoconvettori più favoriti saranno caldi e gli altri freddi.

Capii che l’idraulico finalmente si spiegava perché di tutti gli impianti a termoconvettori che aveva montato nessuno funzionava bene.

Perciò aggiunsi:

  • Devi andare al centro della casa e staccare delle condotte identiche per tutti i termoconvettori.

L’idraulico era convinto, ma non si voleva arrendere e chiese:

  • E quali diametri devo mettere?

Risposi:

  • L’attacco dei termoconvettori è 1/2 pollice, quindi parti da questo con 1/2 pollice. Poi non ti devo insegnare io che quando incontrerai un altro 1/2 pollice dovrai mettere un tubo da 3/4 e così via.

In sostanza l’impianto funzionò da subito perfettamente e con una temperatura interna di 5° arrivava a 18° in meno di due ore. I termoconvettori mandavano aria calda riscaldando la casa uniformemente senza calcoli astrusi e modelli matematici complicati.

Se avessimo usato i calcoli numerici sofisticati dell’ingegnere “esperto” avremmo avuto grossi problemi a far salire la temperatura in alcune stanze in quanto era sbagliato il modello di calcolo.

Faccio osservare che l’uso di modelli errati nel caso dell’economia produce danni che possono distruggere il futuro di molte persone.

Questo è il testo dell’articolo di Russell.

THE MONIST – VOL. XXIV. Gennaio, 1914. NO. 1

SULLA NATURA DELLA CONOSCENZA. – DESCRIZIONE PRELIMINARE DELL’ ESPERIENZA.

Lo scopo di ciò che segue è quello di sostenere una sicura analisi degli aspetti più semplici e più penetranti dell’esperienza, vale a dire quello che io chiamo “conoscenza”. Sosterrò che la conoscenza è una relazione duale tra un soggetto e un oggetto che non devono avere alcuna natura comune. Il soggetto è “mentale”, l’oggetto non è noto per essere mentale, tranne nell’introspezione. L’oggetto può essere nel presente, nel passato, o per nulla affatto nel tempo; può essere un particolare sensibile, o un universale, o un fatto logico astratto. Tutte le relazioni cognitive – attenzione, sensazione, memoria, immaginazione, credere, non credere, ecc. – presuppongono la conoscenza.

Questa teoria deve essere difesa dalle tre teorie rivali: (I) la teoria di Mach e James, secondo la quale non vi è alcuna relazione distintiva come “conoscenza”, coinvolta in tutti i fatti mentali, ma solo un diverso raggruppamento degli stessi oggetti come quelli trattati dalle scienze non psicologiche; (2) la teoria che l’oggetto prossimo è mentale, così come il soggetto; (3) la teoria che tra soggetto e oggetto vi sia una terza entità, il “contenuto”, che è mentale, ed è questo il pensiero o stato della mente per mezzo del quale il soggetto apprende l’oggetto.

La prima di queste tesi avversarie è la più interessante e la più formidabile, e può essere affrontata solo per mezzo di  una discussione completa e dettagliata, che occuperà un secondo saggio. Le altre teorie, insieme con la mia, saranno considerate in un terzo saggio, mentre il primo saggio sarà costituito da un esame introduttivo di dati.

La parola “esperienza”, come la maggior parte delle parole che esprimono idee fondamentali in filosofia, è stata importata nel vocabolario tecnico dal linguaggio della vita quotidiana, e conserva qualcosa della sporcizia per la sua esistenza all’esterno nonostante qualche lavaggio e spazzolatura da filosofi insofferenti. In origine, la “filosofia dell’esperienza” era opposta alla filosofia a priori ‘, e l’ “esperienza” era confinata a ciò che apprendiamo attraverso i sensi. Gradualmente, tuttavia, il campo di applicazione è stato ampliato fino a comprendere tutto ciò di cui siamo in qualche modo coscienti, e divenne lo slogan di un idealismo svuotato di vigore importato dalla Germania. La parola aveva, da un lato, le associazioni rassicuranti del “ricorso per esperienza”, che sembrava precludere stravaganze selvagge di metafisici trascendentali; mentre d’altra parte teneva, per così dire in soluzione, la dottrina che nulla può accadere se non come “esperienza” di qualche mente. Così, con l’uso di questa sola parola gli idealisti astutamente costrinsero i loro antagonisti all’odio dell’a priori e all’apparente necessità di mantenere il vuoto dogma di una realtà inconoscibile, che deve, si pensava, essere del tutto arbitraria o non realmente inconoscibile .

Nella rivolta contro l’idealismo, sono state avvertite le ambiguità della parola “esperienza”, con il risultato che i realisti hanno sempre più evitato la parola. È da temere, tuttavia, che se viene evitata la parola le confusioni di pensiero con cui è stato associata possono persistere. Sembra meglio perseverare nel tentativo di analizzare e chiarire le idee un po’ vaghe e oscure comunemente chiamate con la parola “esperienza”, poiché non è improbabile che in questo processo possa venire avanti qualcosa di fondamentale importanza per la teoria della conoscenza.

Una certa difficoltà per quanto riguarda l’uso delle parole è inevitabile qui, come in tutte le indagini filosofiche. I significati delle parole comuni sono vaghe, fluttuanti e ambigue, come l’ombra gettata da un tremolante lampione in una notte di vento; ancora nel nucleo di questa incerto frammento di significato, possiamo trovare qualche preciso concetto per il quale la filosofia richiede un nome. Se scegliamo un nuovo termine tecnico, il collegamento con il pensiero ordinario è oscurato e la chiarificazione del pensiero ordinario è ritardata; ma se usiamo la parola comune con un nuovo preciso significato, possiamo sembrare in contrasto con l’uso, e possiamo confondere i pensieri del lettore con associazioni non pertinenti. E’ impossibile stabilire una regola per evitare questi pericoli opposti; a volte sarà bene introdurre un nuovo termine tecnico, a volte sarà meglio affinare la parola comune finché non diventi adatta agli utilizzi tecnici. Nel caso di “esperienza”, la seconda soluzione appare preferibile, poiché l’effettivo processo di affinamento della parola è istruttivo, e la confusione di pensiero che riveste non può ben essere altrimenti dissipata.

Nel cercare l’idea centrale compresa nella parola “esperienza”, staremmo allo stesso tempo effettuando le analisi necessarie per una definizione di “mente” e “mentale”.

Il senso comune divide gli esseri umani in anime e corpi, e la filosofia Cartesiana ha generalizzato questa divisione classificando tutto ciò che esiste o come mente o come materia.

Questa divisione è così familiare, e di tale rispettabile antichità, che è diventata parte delle nostre abitudini, e sembra quasi comprendere una teoria. La mente è ciò che conosciamo da dentro – pensieri, sentimenti e volizioni – mentre la materia è ciò che è nello spazio fuori dalla nostra mente. Tuttavia, quasi tutti i grandi filosofi fin da Leibniz hanno messo in discussione il dualismo fra mente e materia. La maggior parte di loro, per quanto riguarda la mente come qualcosa di immediatamente dato, l’hanno assimilata a quello che sembrava essere “materia”, e hanno così raggiunto il monismo dell’idealista. Possiamo definire un idealista come un uomo che crede che tutto ciò che esiste può essere chiamato “mentale”, nel senso di avere una certa qualità, nota a noi dall’introspezione come appartenente alle nostre menti. In tempi recenti, tuttavia, questa teoria è stata criticata da diversi punti di vista. Da un lato, gli uomini che hanno ammesso che conosciamo mediante introspezione gli oggetti aventi la qualità che chiamiamo “mentale” hanno insistito che conosciamo anche altri oggetti che non hanno questo carattere. D’altro canto, William James e i realisti americani hanno insistito che non vi è alcuna qualità specifica degli oggetti “mentali”, ma che gli oggetti che sono chiamati mentali sono identici agli oggetti che sono chiamati fisici, la differenza è solo quella del contesto e della disposizione.

Abbiamo quindi tre pareri da considerare. Ci sono in primo luogo quelli che negano che ci sia una qualità chiamata “mentale” che si rivela in introspezione. Questi uomini possono essere chiamati “monisti neutrali”, perché, pur respingendo la divisione del mondo in mente e materia, non dicono “tutta la realtà è la mente,” tuttavia non affermano che “tutta la realtà è materia.” Quindi, ci sono “idealisti monisti “, che ammettono una qualità chiamata” mentale “, e sostengono che ogni oggetto ha questa qualità.

Poi, ci sono i “dualisti”, che sostengono che vi è una tale qualità, ma che esistono oggetti che non la posseggono.

Per decidere tra questi punti di vista, è necessario decidere se si intende qualcosa con la parola “mentale”; e questa domanda ci riporta al significato di “esperienza”.

Quando consideriamo il mondo senza la conoscenza e l’ignoranza che vengono insegnate dalla filosofia, ci sembra di vedere che contiene una serie di oggetti e di persone, e che alcune delle cose vengono “sperimentate” da alcune delle persone. Un uomo può sperimentare oggetti diversi in tempi diversi, e diversi uomini possono sperimentare oggetti diversi allo stesso tempo. Alcune cose, come l’interno della terra o l’altra faccia della luna, non sono mai stati sperimentato da nessuno, ma comunque ritenuti che esistano. Le cose che un uomo si dice che esperimenti sono le cose che vengono fornite nelle sensazioni, i suoi pensieri e sentimenti (in ogni caso quanto egli ne è a conoscenza), e forse (anche se su questo punto il buon senso potrebbe esitare) i fatti che egli viene a sapere pensando.

In ogni momento, ci sono alcune cose di cui un uomo è “consapevole”, certe cose che sono “prima della sua mente.” Ora, anche se è molto difficile da definire “consapevolezza”, non è affatto difficile dire che io sono a conoscenza di queste e queste cose. Se mi viene chiesto, posso rispondere che io sono consapevole di questo e quello, e quell’altro, e così via attraverso una collezione eterogenea di oggetti. Se descrivo questi oggetti, io naturalmente li descrivo in modo errato; quindi non posso con certezza comunicare ad un altro quali sono le cose di cui sono a conoscenza. Ma se parlo a me stesso, e li indico con quelli che possono essere chiamati “nomi propri”, piuttosto che con le parole descrittive, non posso essere in errore. Finché i nomi che uso davvero sono i nomi al momento, ovvero, sono per me nomi di cose, purché le cose debbano essere oggetti di cui sono a conoscenza, dal momento che altrimenti le parole sarebbero suoni privi di significato, non nomi delle oggetti. Vi è quindi in un dato momento una certa riunione di oggetti a cui ho potuto, se l’ho scelto, dare nomi propri; questi sono gli oggetti della mia “consapevolezza” gli oggetti “prima della mia mente”, o gli oggetti che sono nella mia presente “esperienza”.

C’è una certa unità, importante da comprendere ma difficile da analizzare, nella “mia attuale esperienza.” Se abbiamo ipotizzato che “io” sono lo stesso in un certo istante e in un altro, potremmo supporre che “la mia attuale esperienza” potrebbe essere definita come tutta l’esperienza che “io” ho “ora.”Ma in realtà vedremo che “io” e “ora”, in relazione alla conoscenza, devono essere definiti nei termini di “la mia attuale esperienza”, piuttosto che viceversa. Inoltre, non possiamo definire “la mia attuale esperienza” come “tutte le esperienze contemporanee con questo” (se questa è una qualche parte reale di ciò che ora sperimento), dal momento che sarebbe ignorare la possibilità di esperienze diverse dalle mie. Né possiamo definire come “tutte le esperienze che ho conosciuto come contemporanea con questa,” dal momento che escluderebbe tutte quelle parti della mia esperienza, di cui io non divento introspettivamente cosciente. Dovremo dire, credo, che “stare sperimentando insieme” è una relazione tra gli oggetti dell’esperienza, che possono a loro volta essere sperimentati, per esempio quando ci si rende conto di due cose che stiamo vedendo insieme, o di una cosa vista e di una cosa sentita contemporaneamente.

Avendo imparato a conoscere in questo modo cosa si intende per “sperimentare insieme,” possiamo definire “i miei contenuti attuali di esperienza” come “ogni cosa sperimentata insieme a questo,” ove ciò sia qualsiasi cosa sperimentata con l’attenzione. Torneremo su questo argomento in diverse occasioni successive.

Non mi propongo ancora di tentare una analisi logica di “esperienza.” Per il momento, vorrei prendere in considerazione la sua estensione, i suoi confini, il suo prolungamento nel tempo, e le ragioni per ritenerla come non onnicomprensiva. Questi argomenti possono essere trattati mediante la discussione in successione delle seguenti domande: (1) le sensazioni deboli e periferiche sono incluse nell’ “esperienza”? (2) Tutte o alcune delle nostre attuali convinzioni vere sono incluse nella presente “esperienza”? (3) Facciamo ora “esperienza” di oggetti del passato che ricordiamo? (4) Come veniamo a sapere che il gruppo di cose ora sperimentato non è il tutto? (5) Perché consideriamo le nostre esperienze presenti e passate, come tutte le parti di una sola esperienza, vale a dire l’esperienza che chiamiamo “nostra”? (6) Cosa è che che ci porta a credere che la “nostra” totale esperienza non è un’esperienza onnicomprensiva? Molte di queste domande dovranno essere di nuovo discusse più completamente in una fase successiva; per il momento, non le stiamo discutendo sotto ogni aspetto, ma per acquisire familiarità con il concetto di esperienza.

1. Le sensazioni deboli e periferiche sono incluse nell’ “esperienza”? Questa domanda può essere fatta, non solo per quanto riguarda le sensazioni, ma anche per desideri vaghi, pensieri oscuri, e quant’altro non è al centro dell’attenzione; ma a titolo illustrativo, il caso della sensazione, che è la più semplice, può essere sufficiente. Per motivi di determinatezza, consideriamo il campo visivo. Normalmente, se stiamo assistendo a qualcosa che riguarda il vedere, è a ciò che è al centro del campo che noi partecipiamo, ma possiamo, con uno sforzo di volontà, partecipare a ciò che è al margine. E’ ovvio che, quando lo facciamo, quello di cui ci occupiamo è indubbiamente esperienza.

Così la domanda che dobbiamo considerare è se l’attenzione costituisce esperienza, o se le cose a cui non partecipiamo sono pure esperienza. Sembra che dobbiamo ammettere le cose a cui noi non partecipiamo, perché l’attenzione è una selezione tra gli oggetti che sono “prima nella mente”, e quindi presuppone un campo più ampio, costituito in qualche modo meno esclusivo, di cui l’attenzione sceglie quello che vuole. Nei casi, invece, dove, nonostante le condizioni fisiche che potrebbero essere suscettibili di produrre una sensazione, nessuna sensazione sembra sussistere, come per esempio quando non riusciamo a sentire un suono debole che dovremmo sentire se la nostra attenzione fosse stata richiamata su questo, sembrerebbe che non ci sia una corrispondente “esperienza”; in tali casi, nonostante l’esistenza fisica del suono-stimolo, non sembra esserci talvolta nessuna risposta “mentale”.

2. La nostra vita mentale è in gran parte composta di convinzioni, e di ciò che ci piace chiamare “conoscenza” dei “fatti”.

Quando parlo di un “fatto”, intendo il genere di cosa che si esprime con la frase “questo così e così è il caso.” Un “Fatto” in questo senso è qualcosa di diverso da un oggetto sensibile esistente; è il tipo di oggetto verso cui abbiamo una convinzione, espressa con una proposizione. La domanda che mi sto facendo adesso non è se credere è esperienza, perché questo lo assumo che sia  ovvio; la domanda è, se i fatti verso i quali sono dirette le convinzioni sono mai esperienza. E’ evidente immediatamente che la maggior parte dei fatti che riteniamo essere nella nostra conoscenza non sono ottenuti con l’esperienza. Noi non facciamo esperienza che la terra gira intorno al sole, o che Londra ha sei milioni di abitanti, o che Napoleone è stato sconfitto a Waterloo. Penso, tuttavia, che alcuni fatti sono dovuti all’esperienza, cioè quelli che vediamo noi stessi, senza fare affidamento né sui nostri ragionamenti derivanti da fatti precedenti, o sulla testimonianza degli altri. Questi fatti “primitivi”, che sono noti a noi da una visione immediata luminosa e indubitabile come quella di un senso, devono, se non erro, essere inclusi nella materia originale dell’esperienza. La loro importanza nella teoria della conoscenza è molto grande, e avremo occasione di considerarle molto completamente nel seguito.

3. Dobbiamo ora sperimentare le cose del passato che ricordiamo? Non possiamo ovviamente discutere di questo problema in modo adeguato, senza una analisi della psicologia della memoria. Ma in una breve via preliminare, qualcosa si può dire per indicare una conclusione positiva. In primo luogo, non dobbiamo confondere vera memoria con le immagini attuali di cose passate. Posso richiamare ora alla mia mente l’immagine di un uomo che ho visto ieri; l’immagine non è nel passato, e certamente ne faccio esperienza adesso, ma l’immagine in sé stessa non è memoria.

Il ricordo si riferisce a qualcosa di noto per essere nel passato, per quello che ho visto ieri, non l’immagine che io richiamo adesso. Ma anche quando l’immagine attuale è stato messa via come irrilevante, rimane ancora una distinzione tra ciò che può essere chiamata memoria “intellettuale” e ciò che può essere chiamato memoria “di sensazione”. Quando soltanto so “che ho visto ieri Jones,” questa è memoria intellettuale; la mia conoscenza è uno di questi “fatti primitivi”, che abbiamo considerato nel paragrafo precedente. Ma nella memoria immediata di qualcosa che è appena successo, la cosa stessa sembra rimanere nell’esperienza, nonostante il fatto che è nota per non essere più presente. Quanto tempo questo tipo di memoria può durare, io non pretendo di sapere; ma può certamente durare abbastanza a lungo per farci consapevoli di un lasso di tempo da quando la cosa ricordata era presente.

Così sembrerebbe che in due diversi modi le cose del passato possono formare parti di esperienze presenti.

La conclusione che le cose passate sono sperimentate nella memoria può essere rafforzata considerando la differenza tra passato e futuro. Attraverso la previsione scientifica, possiamo arrivare a conoscere, con maggiore o minore probabilità, molte cose per il futuro, ma tutte queste cose sono supposte: nessuna di esse è nota al momento attuale. Noi non sappiamo nemmeno adesso cosa si intende con la parola “futuro”: il futuro è essenzialmente quel periodo di tempo in cui il presente sarà passato. “Presente” e “passato” sono dati dall’esperienza, e “futuro” è definito nei termini di questi. La differenza tra passato e futuro, dal punto di vista della teoria della conoscenza, consiste proprio nel fatto che il passato è in parte sperimentato ora, mentre il futuro rimane ancora totalmente al di fuori dell’esperienza.

4. Come veniamo a sapere che il gruppo di cose ormai sperimentato non riguarda la totalità? Questa domanda sorge spontanea su quanto è stato appena detto riguardo il futuro; perché la nostra convinzione che ci sarà un futuro è solo una cosa che ci porta al di là dell’esperienza presente. Non è, tuttavia, una delle più indubbbie; non abbiamo alcuna buona ragione per sentirci sicuri che ci sarà un futuro, mentre alcuni dei modi in cui la realtà deve trascendere l’esperienza presente sembrano certi come qualsiasi conoscenza.

La domanda è di grande importanza, perché ci introduce a tutto il problema di come la conoscenza può trascendere l’esperienza personale. Per il momento, però, non siamo interessati a tutta la nostra esperienza individuale, ma solo all’esperienza di un dato momento.

A prima vista potrebbe sembrare come se l’esperienza di ogni momento debba essere una prigione per la conoscenza di quel momento, e come se i suoi confini debbano essere i confini del nostro mondo attuale. Ogni parola che ora capiamo deve avere un significato che ricade all’interno della nostra esperienza presente; non possiamo mai indicare un oggetto e dire: “. Questo si trova fuori dalla mia attuale esperienza”. Non possiamo conoscere qualsiasi oggetto particolare a meno che sia parte della presente esperienza; quindi si potrebbe dedurre che non possiamo sapere che ci sono cose particolari che esulano dall’esperienza presente. Il supporre che possiamo sapere questo, si potrebbe dire, è supporre che possiamo conoscere ciò che non conosciamo. Su questa base, possiamo essere spinti ad un modesto agnosticismo per quanto riguarda tutto ciò che si trova fuori dalla nostra coscienza momentanea. Un tale punto di vista, è vero, di solito non è sostenuto in questa forma estrema; ma i principi del solipsismo e della vecchia filosofia empirica sembrerebbero, se applicati rigorosamente, ridurre la conoscenza di ogni momento entro il campo ristretto dell’esperienza del momento.

Per questa teoria ci sono due repliche complementari.

Una è empirica, e consiste nel sottolineare che in realtà conosciamo più di quello che la teoria suppone; l’altro è logico, e consiste nell’indicare un errore nell’inferenza che la teoria trae dai dati. Cominciamo con la confutazione empirica.

Una delle ovvie confutazioni empiriche deriva dalla consapevolezza che abbiamo dimenticato qualcosa.

Quando, per esempio, cerchiamo di ricordare il nome di una persona, possiamo essere assolutamente certi che il nome è entrato nella nostra esperienza in passato, ma per quanti sforzi facciamo non entrerà nella nostra esperienza attuale. Quindi di nuovo, in più regioni astratte sappiamo che ci sono fatti che non sono all’interno della nostra esperienza attuale; possiamo ricordare che ci sono 144 voci nella tavola delle tabelline, senza ricordarle tutte individualmente; e possiamo sapere che ci sono un numero infinito di fatti nell’aritmetica, di cui solo un numero finito sono ora presenti alla nostra mente. In entrambi i casi di cui sopra, abbiamo la certezza, ma in un caso la cosa dimenticata una volta ha fatto parte della nostra esperienza, mentre nell’altro, il fatto non sperimentato è un fatto matematico astratto, non è un oggetto particolare esistente nel tempo. Se siamo disposti ad ammettere qualsiasi delle credenze della vita quotidiana, come ad esempio che ci sarà un futuro, noi ovviamente abbiamo una grande estensione di ciò che esiste, senza essere sperimentato. Sappiamo dalla memoria che finora abbiamo sempre preso coscienza, nella sensazione, di nuovi particolari non sperimentati prima, e che quindi tutta la nostra esperienza passata non sia la totalità dei fatti. Se, poi, il momento presente non è l’ultimo momento della vita dell’universo, dobbiamo supporre che il futuro conterrà cose che noi non sperimentiamo ora. Non è una risposta il dire che, dal momento che queste cose sono il futuro, non fanno ancora parte dell’universo; esse devono, in ogni istante, essere incluse in qualsiasi inventario completo dell’universo, che deve enumerare ciò che è deve succedere tanto quanto ciò che è e ciò che è stato. Per le ragioni di cui sopra, allora, è certo che il mondo contiene alcune cose non nella mia esperienza, ed è molto probabile che contenga un gran numero di queste cose.

Resta da dimostrare la possibilità logica della conoscenza che ci sono cose che non stiamo ora sperimentando. Questo dipende dal fatto che noi possiamo conoscere proposizioni del tipo: “Ci sono oggetti che hanno tale e tale proprietà”, anche quando non sappiamo di alcun caso di queste cose. Nel mondo matematico astratto, è molto facile trovarne esempi. Per esempio, sappiamo che non esiste il più grande numero primo. Ma di tutti i numeri primi che avremo mai pensato, vi è certamente uno più grande. Quindi ci sono numeri primi maggiori di quelli che avremo mai pensato. Ma in termini più concreti, lo stesso è vero: è perfettamente possibile sapere che ci sono cose che ho conosciuto, ma ora ho dimenticato, anche se ovviamente è impossibile fornire un esempio di queste cose. Per ricorrere al nostro esempio precedente, posso ricordare perfettamente che ieri ho saputo il nome della signora che mi hanno presentato, anche se oggi ne ho dimenticato il nome. Che mi sia stato detto il suo nome, è un fatto che io conosco, e che implica che io sapevo una cosa particolare che non so più; so che c’era una cosa particolare, ma io non so quale cosa particolare fosse. Proseguire questo argomento più oltre richiederebbe una relazione sulla “conoscenza per descrizione”, che appartiene ad una fase successiva. Per il momento, io sono soddisfatto di aver fatto notare che sappiamo che ci sono cose al di fuori dell’esperienza presente e che tale conoscenza non solleva difficoltà logiche.

5. Perché consideriamo le nostre esperienze presenti e passate, come tutte le parti di una sola esperienza, vale a dire l’esperienza che chiamiamo “nostra”? Questa domanda deve essere considerata prima di poter passare alla ulteriore domanda, se possiamo sapere che ci sono cose che trascendono tutta la “nostra” esperienza. Ma al nostro attuale stadio possiamo fornire solo una breve osservazione preliminare, tale che ci permetterà di parlare della totale esperienza di una persona con una certa comprensione di ciò che intendiamo e quali sono le difficoltà che comporta.

E‘ ovvio che la memoria è ciò che chiamiamo esperienze passate “nostre.” Io non intendo dire che solo le esperienze che noi ora ricordiamo sono considerate come la nostre, ma che la memoria costruisce sempre gli anelli della catena che lega il nostro presente con il nostro passato. Non è, tuttavia, la memoria di per sé che fa questo: è una memoria di un certo tipo. Se ci limitiamo a ricordare qualche oggetto esterno, l’esperienza è nel presente, e non vi è ancora alcun motivo di assumere l’esperienza passata. Sarebbe logicamente possibile ricordare un oggetto che non avessimo mai sperimentato; anzi, non è affatto certo che questo a volte non si verifichi. Possiamo sentire un orologio a suoneria, per esempio, e rendersi conto che ha già suonato diverse volte prima che l’avessimo notato. Forse, in questo caso, abbiamo effettivamente sperimentato i rintocchi precedenti al momento in cui si sono verificati, ma non possiamo ricordare di averlo fatto. Così il caso serve ad illustrare una differenza importante, ossia la differenza tra ricordare un evento esterno e il ricordare la nostra esperienza dell’evento. Normalmente, quando ricordiamo un evento, ricordiamo anche la nostra esperienza di esso, ma le due sono memorie differenti, come dimostra il caso dell’orologio a suoneria. La memoria che prolunga la nostra personalità a ritroso nel tempo è la memoria della nostra esperienza, non solo delle cose che abbiamo sperimentato. Quando possiamo ricordare di aver sperimentato qualcosa, includiamo l’esperienza ricordata con la nostra presente esperienza come parte dell’esperienza di una persona.

Così siamo portati a includere anche qualsiasi esperienza avessimo ricordato nel periodo precedente, e così indietro, ipoteticamente, fino alla prima infanzia. Allo stesso modo ipotetico, abbiamo tratto la nostra personalità in avanti nel tempo per tutte le esperienze che ricorderanno le nostre esperienze presenti direttamente o indirettamente. 1

1 Nel linguaggio della logica delle relazioni, se M è la relazione “ricordare”, N la somma di M e della sua inversa, e r è un momento di esperienza, l’esperienza totale a cui appartiene x sono tutti i momenti di esperienza che hanno con x la relazione N *. Cfr. Principia Mathematica, * 90.

Con questa estensione dell’esperienza presente in una serie di esperienze legate dalla memoria, includiamo nella nostra esperienza totale tutte quelle particolari, di cui si parla sotto l’ultimo nostro titolo, che sono note per essere esistite, anche se non fanno parte dell’esperienza presente; e nel caso il tempo dovesse continuare oltre il momento presente, includiamo anche quelle future esperienze che saranno collegate al nostro presente come il nostro presente è collegato al nostro passato.

6. Cosa ci porta a credere che la “nostra” esperienza complessiva non comprende tutto? Questa è la domanda del solipsismo: Che ragione abbiamo per credere che qualche cosa esista o sia esistita o esisterà tranne ciò che fa parte della nostra esperienza complessiva, nel senso spiegato nel paragrafo precedente?

L’argomentazione logica con cui abbiamo dimostrato che è possibile conoscere l’esistenza di cose che sono fuori dell’esperienza presente si applica, senza modifiche, all’esistenza di cose che si trovano al di fuori della nostra esperienza complessiva. Quindi l’unica domanda che dobbiamo considerare è se, come dato di fatto empirico, sappiamo tutto ciò che dimostra l’esistenza di tali cose. Nell’area della logica matematica astratta, è facile, per mezzo degli esempi stessi che abbiamo usato prima, dimostrare che ci sono fatti che non fanno parte della nostra esperienza complessiva. Sembra certo che non possiamo pensare più di un numero finito di fatti aritmetici nel corso della nostra vita, e sappiamo che il numero totale dei fatti aritmetici è infinita. Se questo esempio venisse considerato non conclusivo, per il fatto che forse sopravviviamo alla morte e diventeremmo più interessati all’aritmetica di seguito, il seguente esempio sarà trovato più pertinente. Il numero di funzioni di una variabile reale è infinitamente maggiore del numero degli istanti di tempo.

Quindi anche se spendessimo tutta l’eternità a pensare una nuova funzione ogni istante, o un piccolo infinito numero di nuove funzioni ogni istante, ci sarebbe ancora un numero infinito di funzioni che non avremmo pensato, e quindi un infinito numero di fatti su cui non entrerebbe mai la nostra esperienza. E’ quindi certo che ci sono fatti matematici che non entrano nella nostra esperienza totale.

Per quanto riguarda i particolari esistenti, un tale argomento convincente, per quanto ne so, può essere prodotto. Noi naturalmente supponiamo che i corpi di altre persone siano abitati da menti più o meno come la nostra, che sperimentano piaceri e dolori, desideri e avversioni, di cui non abbiamo consapevolezza diretta. Ma anche se noi naturalmente supponiamo questo, e anche se non possiamo attribuire nessuna ragione per credere che la nostra supposizione è errata, tuttavia sembrerebbe anche che non vi è motivo determinante per ritenere che non è  un errore. Esattamente lo stesso grado di dubbio è connesso con l’interno della terra, l’altra faccia della luna, e innumerevoli fatti fisici che abitualmente assumiamo senza la garanzia dell’esperienza diretta. Se ci sono buone ragioni per credere in qualsiasi di queste cose, ciò deve derivare dall’induzione e la causalità con un processo complicato che non siamo attualmente in grado di prendere in considerazione. Per il momento, assumiamo come ipotesi di lavoro l’esistenza di altre persone e delle cose fisiche non percepibili. Di tanto in tanto dobbiamo rivedere questa ipotesi, e alla fine saremo in grado di farci un’idea degli elementi di prova circa la sua verità.

Per il momento, dobbiamo essere soddisfatti con le conclusioni: (a) che non vi è alcuna ragione logica contro di essa, (b) che nel mondo logica ci sono certamente fatti di cui non facciamo esperienza, (c) che il presupposto senso comune che vi sono particolari di cui non abbiamo esperienza è stata trovato come un assoluto successo come ipotesi di lavoro, e che non vi è alcun argomento di qualsiasi tipo o genere contro di esso.

La conclusione a cui siamo stati guidati dalla discussione di cui sopra è che alcune delle cose del mondo, ma non tutte, sono raccolte insieme in ogni momento della mia vita cosciente in un gruppo che può essere chiamato “la mia attuale esperienza”; che questo gruppo comprende le cose esistenti ora, cose che esistevano in passato, e fatti astratti; anche che nella mia esperienza di una cosa, è coinvolto qualcosa di più del semplice oggetto, e può essere sperimentato nella memoria; che in tal modo un gruppo completo delle mie esperienze nel corso del tempo può essere definito mediante la memoria, ma che questo gruppo, come gruppo momentaneo, di certo non contiene tutti i fatti astratti, e sembra non contenere tutti i particolari esistenti, e specialmente non contenere l’esperienza che crediamo essere associata con i corpi delle altre persone.

Ora dobbiamo considerare cosa è l’analisi di “sperimentare” i. e., qual è il legame che unisce certi oggetti nel gruppo che costituisce una esperienza momentanea.

E qui dobbiamo prima considerare la teoria che abbiamo chiamato “monismo neutrale,” dovuta a William James; perché le domande sollevate da questa teoria sono così fondamentali che fino a che non trovano risposta, in un modo o in un altro, non possono essere fatti ulteriori progressi.

BERTRAND RUSSELL.

CAMBRIDGE, Inghilterra.

Mathematical Logic as based on the Theory of Types – By Bertrand Russell

23 Set

Honourable_Bertrand_Russell

Riporto di seguito la traduzione del  testo pubblicato in American Journal of Mathematics Vol. 30 No 3 (Luglio 1908) pp. 222-262.

La traduzione è stata fatta sul testo pubblicato da The Johns Hopkins University Press ed è visibile all’indirizzo

http://www.jstor.org/stable/2369948 .

Questa elaborazione della Teoria dei Tipi finalizzata all’eliminazione di alcune contraddizioni della logica matematica è importante anche perché è stata la base dell’elaborazione della logica matematica di Frank Ramsey  in particolare in The Foundation of Mathematics nonché  dell’elaborazione logica di Ludwig Wittgenstein nel “Tractatus” per alcune parti come il concetto di uguaglianza.

Pertanto questo testo è importante per capire alcune parti dell’elaborazione logico-filosofica di due dei primi rappresentanti dell’ingegneria della conoscenza.

Questa è la traduzione.

La Logica matematica sulla base della teoria dei tipi.

 DI BERTRAND RUSSELL. 

La seguente teoria della logica simbolica mi viene consigliata in primo luogo per la sua capacità di risolvere alcune contraddizioni, di cui quella più nota ai matematici è la Burali-Forti riguardante il più grande ordinale.* Ma la teoria in questione non sembra totalmente dipendente da questa indicazione indiretta; ha anche, se non mi sbaglio, una certa consonanza con il senso comune che la rende intrinsecamente credibile. Questo, tuttavia, non è un merito a cui sarebbe da attribuire molta enfasi; perché il senso comune è molto più fallibile di quello che ci piace pensare. Pertanto comincerò esponendo alcune delle contraddizioni da risolvere, e poi mostrerò come la teoria dei tipi logici determini la loro soluzione.

* Vedi sotto.

I

Le contraddizioni. 

(1) La  più antica contraddizione del genere in questione è quella di Epimenide.

Epimenide il cretese dice che tutti i cretesi erano bugiardi, e tutte le altre affermazioni fatte da Cretesi erano certamente bugie. Era questa una bugia? La forma più semplice di questa contraddizione è offerta da un uomo che dice “Io sto mentendo”; se sta mentendo, sta dicendo la verità, e viceversa.

(2) Sia w la classe di tutte le classi che non sono membri di se stesse. Quindi, qualsiasi classe x sia, “x è un w” è equivalente † a “x non è un x.” Quindi, dando alla x il valore w, “w è un w” è equivalente a “w non è un w.”

† Due proposizioni sono dette equivalenti quando sono entrambe vere o entrambe sono false.

(3) Sia T il rapporto che sussiste tra due relazioni R e S ogniqualvolta che R non ha la relazione R con S. Quindi, quale che possano essere le relazioni R e S, “R ha la relazione T con S” è equivalente a “R non ha la relazione R con S. “Quindi, dando il valore T sia a R sia a S, “T ha la relazione T con T” è equivalente a “T non ha la relazione T con T.”

(4) Il numero di sillabe nei nomi in inglese di un numero intero finito tende ad aumentare con il crescere dei numeri interi più rapidamente, e devono gradualmente aumentare indefinitamente, dal momento che solo un numero finito di nomi può essere fatta con un determinato numero finito di sillabe. Perciò i nomi di alcuni numeri interi deve essere composto da almeno diciannove sillabe, e tra queste ci deve essere un minimo. Quindi “il minimo intero non nominabile in meno di diciannove sillabe” deve indicare un numero intero definito; infatti, denota 111.777. Ma “il minimo intero non nominabile in meno di diciannove sillabe” è di per sé un nome composto da diciotto sillabe; quindi il minimo intero non nominabile in meno di diciannove sillabe può essere nominato in diciotto sillabe, che è una contraddizione. *

* Questa contraddizione mi è stata suggerita dal signor G.G. Berry della Bodleian Library.

(5) Tra gli ordinali transfiniti alcuni possono essere definiti, mentre altri non possono esserlo; perché il numero totale di possibili definizioni è ℵ0, mentre il numero degli ordinali transfiniti supera ℵ0. Quindi ci devono essere ordinali indefinibili, e tra questi ci deve essere un minimo. Ma questo è definito come “il minimo ordinale indefinibile”, che è una contraddizione. †

† Cf. König, “Ueber die Grundlagen der Mengenlehre und das Kontinuumproblem,” Math. Annalen, vol. LXI (1905); A.C. Dixon, “On ‘Well ordered, “aggregates, “Proc. London Math. Soc., Serie 2, vol. IV, parte I (1906); e E.W. Hobson, “On the Arithmetic Continuum”, ibid. La soluzione offerta nell’ultimo di questi articoli non mi sembra adeguata.

6) Il paradosso di Richard ‡ è simile a quella del minimo ordinale indefinibile. Esso è il seguente: Si considerino tutti i decimali che possono essere definiti mediante un numero finito di parole; sia E la ​​classe di tali decimali. Allora E ha ℵ0 termini; quindi i suoi membri possono essere ordinati come il 1 °, 2 °, 3 °, .. .. Sia N un numero definito come segue: Se la cifra ennesima nell’ennesimo decimale è p, sia l’ennesima cifra in  N p + 1 (o 0, se p = 9). Allora N è diverso da tutti i membri della classe E, poiché, qualunque valore finito n possa avere, l’ennesima cifra in N è diversa dalla cifra ennesima nell’ennesimo dei decimali che compone la classe E, e quindi N è diverso nell’ennesimo decimale. Tuttavia abbiamo definito N in un numero finito di parole, e quindi N dovrebbe essere un membro di E. Quindi N è sia membro e sia non membro di E.

‡ Cf. Poincaré, “Les mathématiques et la logique,” Revue de Metaphysique et de Morale, Mai, 1906, in particolare le sezioni VII e IX; anche Peano, Revista de Mathematica, vol. VIII, No. 5 (1906), p. 149 ss.

(7) La contraddizione § di Burali-Forti può essere definita come segue: si può dimostrare che ogni serie ben ordinata ha un numero ordinale, che la serie di ordinali fino a e includendo ogni ordinale supera l’ordinale dato per una unità, e (per alcune ipotesi molto naturali) che le serie di tutti gli ordinali (in ordine di grandezza) è ben ordinata. Ne consegue che la serie di tutti gli ordinali ha un numero ordinale, che chiameremo Ω. Ma in questo caso la serie di tutti gli ordinali compreso Ω ha il numero ordinale Ω + 1, che deve essere maggiore di Ω. Quindi Ω non è il numero ordinale di tutti gli ordinali.

§ “Una questione sui Numeri transfiniti”, Rendiconti del Circolo Matematico di Palermo, vol. XI (1897).

In tutte le contraddizioni di cui sopra (che sono solo le selezioni da un numero infinito), vi è una caratteristica comune, che potremmo descrivere come auto-riferimento o riflessività. L’osservazione di Epimenide deve includere se stessa nel suo ambito di applicazione. Se tutte le classi, a condizione che non siano membri di se stesse, sono membri di w, questo deve valere anche per w; e allo stesso modo per l’analoga contraddizione relazionale. Nei casi di nomi e definizioni, i paradossi derivano dal considerare non nominabilità e indefinibilità come elementi nei nomi e nelle definizioni. Nel caso del paradosso di Burali-Forti, la serie il cui numero ordinale provoca la difficoltà è la serie di tutti i numeri ordinali. In ogni contraddizione qualcosa viene detto su tutti i casi di qualche genere, e da quello che viene detto sembra che venga generato un nuovo caso, che sia o meno della stessa natura dei casi in cui “tutto” era implicato in quanto è stato detto. Esaminiamo le contraddizioni una per una e vediamo come queste avvengano.

(1) Quando una persona dice: “Io sto mentendo”, possiamo interpretare la sua dichiarazione come: “Esiste una proposizione che io sto affermando e che è falsa” Tutte le affermazioni che “esiste” così-e-così possono essere considerate come il negare che il contrario è sempre vero; così “Io sto mentendo” diventa: “Non è vero di tutte le proposizioni che o io non le sto affermando o sono vere;” in altre parole: “Non è vero per tutte le proposizioni p che se io affermo p, p è vera.” Il paradosso risulta dal considerare questa affermazione come se affermasse una proposizione, che deve quindi rientrare nel campo di applicazione della affermazione. Questo, però, rende evidente che la nozione di “tutte le proposizioni” è illegittima; perché altrimenti, ci devono essere proposizioni (come quelle di cui sopra) che riguardano tutte le proposizioni, e tuttavia non possono, senza contraddizione, essere incluse tra le proposizioni che le riguardano. Qualunque cosa supponiamo essere la totalità delle proposizioni, le affermazioni su questa totalità generano nuove proposizioni che, a costo di una contraddizione, devono trovarsi al di fuori della totalità. Questo è inutile per ingrandire la totalità, perché questo allarga ugualmente il campo delle affermazioni circa la totalità. Quindi non ci deve essere nessuna totalità di proposizioni, e “tutte le proposizioni” deve essere una frase priva di senso.

(2) In questo caso, la classe w è definita con riferimento a “tutte le classi”, e quindi si rivela essere una fra le classi. Se noi cerchiamo aiuto ritenendo che nessuna classe è un membro di se stessa, allora w diventa la classe di tutte le classi, e dobbiamo decidere che questa non è un membro di se stessa, i. e., non è una classe. Questo è possibile solo se non esiste un oggetto come la classe di tutte le classi nel senso richiesto dal paradosso. Che non esista nessuna di tali classi risulta dal fatto che, se supponiamo che esista, la supposizione da’ immediatamente luogo (come nella contraddizione di cui sopra) a nuove classi che si trovano al di fuori del presunto totale di tutte le classi.

(3) Questo caso è esattamente analoga alla (2), e dimostra che non si può legittimamente parlare di “tutte le relazioni.”

(4) “Il minore intero non nominabile in meno di diciannove sillabe” coinvolge la totalità dei nomi, perché è “il minimo intero tale che tutti i nomi o non si applicano ad esso o hanno più di diciannove sillabe.” Qui si assume, per ottenere la contraddizione, che una frase che contiene “tutti i nomi” è essa stessa un nome, anche se appare dalla contraddizione che non può essere uno dei nomi che si supporrebbe essere tutti i nomi che esistono. Quindi “tutti i nomi” è una nozione illegittima.

(5) Questo caso, analogamente, mostra che “tutte le definizioni” è una nozione illegittima.

(6) Questo è risolto, come la (5), osservando che “tutte le definizioni” è una nozione illegittima. Quindi il numero E non è definito in un numero finito di parole, non essendo in realtà definito affatto. *

* Cf. “Les paradoxes de la logique,” dall’autore, Revue de Metaphysique et de Morale, settembre, 1906, p. 645.

(7) la contraddizione di Burali-Forti mostra che “tutti gli ordinali” è una nozione illegittima; perché se non lo fosse, tutti gli ordinali in ordine di grandezza formerebbero serie ben ordinate, che dovrebbe avere un numero ordinale maggiore di tutti gli ordinali.

Così tutte le nostre contraddizioni hanno in comune l’assunzione di una totalità in modo tale che, se fosse legittima, sarebbe immediatamente ampliata da nuovi membri definiti in termini di se stessi.

Questo ci porta alla regola: “Qualunque cosa comporta tutto di un insieme di termini non può essere un termine dell’insieme;” o, al contrario: “Se, purché un certo insieme abbia un totale, avesse membri solo definibile in termini di quel totale, allora detto insieme non ha un totale.” †

† Quando dico che un insieme non ha totale, voglio dire che le affermazioni su tutti i suoi membri non hanno senso. Inoltre, si vedrà che l’uso di questo principio richiede la distinzione fra tutto e qualche considerati nella sezione II.

Il principio di cui sopra è, tuttavia, puramente negativo nel suo campo di validità. E’ sufficiente mostrare che molte teorie sono sbagliate, ma non si vede come gli errori debbano essere rettificati. Non possiamo dire: “Quando parlo di tutte le proposizioni, intendo tutte tranne quelle in cui sono menzionate ‘tutte le proposizioni’;” perché in questa dimostrazione abbiamo menzionato le proposizioni in cui vengono menzionate tutte le proposizioni, a cui non possiamo farlo con significato. E ‘impossibile evitare di menzionare una cosa che non vogliamo dire. Si potrebbe così, nel parlare con un uomo con un lungo naso, dire: «Quando parlo di nasi, ad eccezione di quelli che sono eccessivamente lunghi,” che non sarebbe uno sforzo di grande successo per evitare una spiacevole topica. Quindi è necessario, se non vogliamo venire meno al principio negativo di cui sopra, per costruire la nostra logica, senza menzionare certe cose come “tutte le proposizioni” o “tutte le proprietà”, e senza nemmeno dover dire che noi escludiamo queste cose. L’esclusione deve risultare naturalmente e inevitabilmente dalle nostre dottrine positive, che devono rendere chiaro che “tutte le proposizioni” e “tutte le proprietà” sono frasi prive di senso.

La prima difficoltà che ci sta di fronte sono i principi fondamentali della logica conosciuti sotto il nome caratteristico di “leggi del pensiero.” “Tutte le proposizioni sono vere o false”, per esempio, è diventata priva di senso. Se avesse significato, sarebbe una proposizione, e risulterebbe sotto il suo stesso campo di applicazione.

Tuttavia, qualche sostituto deve essere trovato, o tutte le relazioni generali della deduzione diventerebbero impossibili.

Un’altra difficoltà più particolare è illustrata dal caso particolare dell’induzione matematica. Vogliamo essere in grado di dire: “Se n è un numero intero finito, n ha tutte le proprietà possedute da 0 e dai successori di tutti i numeri che le possiedono” Ma qui “tutte le proprietà” deve essere sostituita da qualche altra frase non soggetta alle stesse obiezioni. Si potrebbe pensare che “tutte le proprietà possedute da 0 e dai successori di tutti i numeri che le possiedono” potrebbe essere legittima anche se “tutte le proprietà” non lo fossero. Ma in realtà non è così. Troveremo che frasi del tipo “tutte le proprietà che ecc.” che coinvolgono tutte le proprietà di cui l’”ecc.” può essere con significato sia affermato sia negato, e non solo quelle che in realtà hanno qualsiasi caratteristica che sia in esame; perché, nella assenza di un catalogo delle proprietà che hanno questa caratteristica, una affermazione su tutto ciò che ha la caratteristica deve essere ipotetica, e nella forma: “E ‘sempre vero che, se una proprietà ha detta caratteristico, allora, ecc.”. Così l’induzione matematica è, prima facie, incapace di essere significativamente enunciata, se “tutte le proprietà” è una frase priva di senso. Questa difficoltà, come vedremo più avanti, può essere evitata; per il momento dobbiamo considerare le leggi della logica, dal momento che queste sono molto più fondamentali.

II. 

Tutto e qualche. 

Data una asserzione contenente una variabile x, diciamo “x = x”, possiamo affermare che questo vale in tutti i casi, o potremmo affermare uno qualsiasi di questi casi senza stabilire riguardo a quale caso stiamo facendo un’asserzione. La distinzione è più o meno la stessa di quella tra l’enunciato generale e il particolare in Euclide. L’enunciato generale ci dice qualcosa circa (diciamo) tutti i triangoli, mentre quello particolare assume un triangolo, e afferma la stessa cosa di questo singolo triangolo. Ma il triangolo assunto è un qualsiasi triangolo, non qualche triangolo specifico; e quindi anche se, in tutta la dimostrazione, viene trattato un solo triangolo, tuttavia la dimostrazione mantiene la sua generalità. Se diciamo: “Sia ABC un triangolo, quindi i lati AB, AC sono presi insieme maggiori del lato BC,” stiamo dicendo qualcosa su un triangolo, non su tutti i triangoli; ma il singolo triangolo in questione è assolutamente ambiguo, e la nostra affermazione è di conseguenza anche assolutamente ambigua. Noi non affermiamo una qualsiasi proposizione definita, ma una indeterminata di tutte le proposizioni derivanti dal supporre ABC essere questo o quel triangolo. Questa nozione di affermazione ambigua è molto importante, ed è fondamentale non confondere un’affermazione ambigua con l’affermazione definita che la stessa cosa vale in tutti i casi.

La distinzione tra (1) che afferma qualsiasi valore di una funzione proposizionale, e (2) che afferma che la funzione è sempre vera, è presente in tutta la matematica, come nella distinzione di Euclide di enunciati generali e particolari. In qualsiasi catena di ragionamento matematico, gli oggetti le cui proprietà sono in fase di studio sono gli argomenti per ogni valore di una funzione proposizionale.

Prendete come esempio la seguente definizione:

“Chiamiamo f (x) continua per x = α se, per ogni numero σ positivo, diverso da 0, esiste un numero positivo ε, diverso da 0, tale che, per tutti i valori di δ numericamente minori di ε, la differenza f (α + δ) – f (α) è numericamente inferiore a σ. ”

Qui la funzione f è una qualsiasi funzione per la quale l’affermazione di cui sopra ha un significato; l’affermazione è intorno ad f, e varia al variare di f. Ma l’affermazione non riguarda σ o ε o δ, perché sono interessati tutti i possibili valori di questi, non un valore indeterminato. (A proposito  di ε, l’affermazione “esiste un numero positivo ε tale che ecc.” è la negazione che la negazione di “eccetera” sia vera per tutti i numeri positivi.) Per questo motivo, quando un qualsiasi valore di una funzione proposizionale è asserito, l’argomento (per esempio, f nel caso di cui sopra) è chiamata variabile reale; mentre, quando una funzione si dice che è sempre vera, o che non sia sempre vera, l’argomento è chiamato variabile apparente. * Così nella definizione di cui sopra, f è una variabile reale, e σ, ε, δ sono variabili apparenti.

* Questi due termini sono dovuti al Peano, che li utilizza pressappoco nel senso di cui sopra. Cfr, e. g., Formulaire Mathématique, vol. IV, p. 5 (Torino, 1903).

Quando affermiamo un qualsiasi valore di una funzione proposizionale, diremo semplicemente che noi asseriamo una funzione proposizionale. Quindi se noi enunciamo la legge di identità nella forma “x = x,” stiamo affermando la funzione “x = x” i. e., la stiamo affermando per qualsiasi valore di questa funzione. Allo stesso modo si può dire negare una funzione proposizionale quando neghiamo qualsiasi caso di essa. Possiamo solo in verità affermare una funzione proposizionale se, qualunque sia il valore che scegliamo, quel valore è vero; allo stesso modo possiamo solo in verità negarla se, qualunque sia il valore che scegliamo, questo valore è falso. Quindi nel caso generale, in cui alcuni valori sono veri e alcuni falsi, non possiamo né affermare né negare una funzione proposizionale. †

† MacColl parla di “proposizioni”, divise in tre classi certe, variabili, e impossibili. Possiamo accettare questa divisione in riferimento alle funzioni proposizionali. Una funzione che può essere affermata è certa, una che può essere negata è impossibile, e tutte le altre sono (nel senso di Mr. MacColl) variabili.

Se φx è una funzione proposizionale, noi indichiamo con “(x). φx” la proposizione “φx è sempre vera.” Allo stesso modo “(x, y). φ (x, y)” significherà “φ (x, y) è sempre vera,” e così via. Quindi la distinzione tra l’affermazione di tutti i valori e l’affermazione di qualche valore è la distinzione tra (1) che afferma (x). φx e (2) che afferma φx dove x è indeterminata. Quest’ultima si differenzia dalla precedente in quanto non può essere trattata come una proposizione definita.

La distinzione tra affermare φx e affermare (x). φx è stata, credo, per la prima volta sottolineata da Frege. ‡

‡ Vedere il suo Grundgesetze der Arithmetik, vol. I (Jena, 1893), § 17, p. 31.

La sua ragione per introdurre esplicitamente la distinzione era la stessa che era stata la causa ad essere presente nella pratica dei matematici; vale a dire, che la deduzione può essere effettuata solo con variabili reali, non con variabili apparenti. Nel caso delle dimostrazioni di Euclide, questo è evidente: abbiamo bisogno di (diciamo) un qualche triangolo ABC per ragionarci su, anche se non importa di quale triangolo si tratti.

Il triangolo ABC è una variabile reale; e sebbene sia un triangolo qualsiasi, esso sussiste come la stesso triangolo in tutto il ragionamento. Ma nell’enunciazione generale, il triangolo è una variabile apparente. Se ci atteniamo alla variabile apparente, non possiamo effettuare nessuna deduzione, e questo è il motivo per cui in tutte le dimostrazioni, devono essere utilizzate le variabili reali. Supponiamo, per prendere il caso più semplice, che sappiamo “‘φx è sempre vera,” i. e. “(x). φx,” e sappiamo “φx implica sempre ψx,” ovvero “(x). {φx implica ψx}.” Come possiamo inferire “ψx è sempre vera”, cioè “(x) .ψx?” Sappiamo che è sempre vero che se φx è vera, e se φx implica ψx, allora ψx è vera.

Ma non abbiamo nessuna premessa secondo cui se φx è vero allora φx implica ψx; quello che abbiamo è: φx è sempre vero, e φx implica sempre ψx. Al fine costruire la nostra deduzione, dobbiamo andare da φx è sempre vero “a φx, e da” φx implica sempre ψx “a” φx implica ψx, “dove la x, pur restando un qualsiasi possibile argomento, deve essere lo stesso in entrambi. Allora, da “φx” e “φx implica ψx,” deduciamo “ψx;” così ψx è vera per ogni possibile argomento, e quindi è sempre vera. Così per dedurre “(x). ψx da” (x). φx “e” (x). {φx implica ψx}, “dobbiamo passare dalla variabile apparente alla variabile reale, e poi di nuovo alla variabile apparente. Questa procedura è necessaria in ogni ragionamento matematico che procede dalla affermazione di tutti i valori di una o più funzioni proposizionali all’affermazione di tutti i valori di qualche altra funzione proposizionale, come, ad esempio, da “tutti i triangoli isosceli hanno uguali gli angoli alla base” a “tutti i triangoli aventi angoli uguali alla base sono isosceli.” In particolare, questo processo è necessario a dimostrare Barbara e gli altri stati del sillogismo.

In una sola parola, qualsiasi deduzione opera con variabili reali (o con costanti).

Si potrebbe supporre che potremmo fare a meno del tutto delle variabili apparenti, accontentandoci di qualche come un sostituto per tutti. Questo, tuttavia, non è il caso. Prendiamo, per esempio, la definizione della funzione continua citata sopra: in questa definizione σ, α e δ devono essere variabili apparenti. Variabili apparenti sono costantemente richieste per le definizioni. Prendiamo, ad esempio, la seguente: “. Un intero è chiamato primo quando non ha fattori interi tranne 1 e se stesso”

Questa definizione implica inevitabilmente una variabile apparente nella forma: “Se n è un numero intero diverso da 1 o dal numero intero dato, n non è un fattore del numero intero dato, per tutti i possibili valori di n”.

La distinzione tra o tutti e qualche è, dunque, necessaria al ragionamento deduttivo, e si verifica in ogni parte della matematica; però, per quanto ne so, la sua importanza è rimasta non notata fino a che Frege la indicò.

Per i nostri scopi ha una utilità diversa, che è molto grande. Nel caso di certe variabili quali proposizioni o proprietà, “qualsiasi valore” è legittimo, anche se “tutti i valori” non lo è. Così possiamo dire: “p è vera o falsa, dove p è una qualsiasi proposizione,” anche se non possiamo dire “tutte le proposizioni sono vere o false.” La ragione è che, nel primo caso , ci limitiamo ad affermare una affermazione indeterminata delle proposizioni nella forma “p è vera o falsa”, mentre nel secondo si afferma (se non altro) una nuova proposizione, diversa da tutte le proposizioni con la forma “p è vera o falsa.” Così possiamo ammettere “qualsiasi valore” di una variabile nei casi in cui “tutti i valori” condurrebbero ad errori riflessivi; perché l’ammettere “qualsiasi valore” non crea nello stesso modo nuovi valori. Quindi le leggi fondamentali della logica possono venir stabilite in merito a qualsiasi proposizione, anche se non possiamo dire in modo sensato che esse sono coerenti con tutte le proposizioni. Queste leggi hanno, per così dire, un particolare enunciato, ma non un enunciato generale. Non esiste una proposizione che è (ad esempio) la legge di contraddizione; esistono solo i vari casi della legge. Di qualsiasi proposizione p, possiamo dire: “p e non-p non possono essere entrambe vere,” ma non esiste una certa proposizione come: “Ogni proposizione p è tale che p e non-p non possono essere entrambe vere. ”

Una spiegazione simile vale per le proprietà. Si può parlare di qualsiasi proprietà di x, ma non di tutte le proprietà, perché nuove proprietà potrebbero essere generate in tal modo. Così possiamo dire: “Se n è un numero intero finito, e se 0 ha la proprietà φ, e m + 1 ha la proprietà φ a condizione che m l’abbia, ne consegue che n ha la proprietà φ.” Qui non abbiamo bisogno di specificare φ; φ sta per “qualsiasi proprietà.”

Ma non possiamo dire: “Un intero finito è definito come un numero che ha ogni proprietà φ posseduta da 0 e dai successori dei possessori.” Perché qui è essenziale prendere in considerazione ogni proprietà, * non qualsiasi proprietà; e nell’uso di tale definizione si assume che esso comprende una proprietà distintiva di interi finiti, che è proprio il tipo di presupposto da cui, come abbiamo visto, nascono le contraddizioni riflessive.

* Questo è indistinguibile da “tutte le proprietà”.

Nel caso di cui sopra, è necessario evitare i suggerimenti del linguaggio ordinario, che non è adatto per esprimere la distinzione necessaria. Il punto può essere illustrato ulteriormente come segue: Se l’induzione deve essere utilizzata per definire interi finiti, un’induzione deve indicare una proprietà definita di numeri interi finiti, non una proprietà ambigua. Ma se φ è una variabile reale, l’affermazione “n ha la proprietà φ a condizione che questa proprietà sia posseduta da 0 e dai successori dei possessori” assegna a n una proprietà che varia al variare di φ, e una tale proprietà non può essere utilizzata per definire la classe dei numeri interi finiti. Vogliamo dire: “‘n è un numero intero finito’ significa: ‘. Qualunque possa essere la proprietà φ, n ha la proprietà φ  a condizione che φ sia posseduto da 0 e dai successori dei possessori'” Ma qui φ è diventata una variabile apparente. Per averla come variabile reale, dovremmo dire: “Qualunque possa essere la proprietà φ, ‘n è un numero intero finito’ significa: ‘n ha la proprietà φ considerato che φ è posseduta da 0 e dai successori dei possessori.'” Ma qui il significato di ‘n è un numero intero finita’ varia al variare di φ, e quindi una tale definizione è impossibile. Questo caso illustra un punto importante, vale a dire quanto segue: “. * L’ambito di una variabile reale non può mai essere minore della intera funzione proposizionale nell’affermazione della quale si afferma che tale variabile si verifica” Cioè, se la nostra funzione proposizionale è (diciamo) “φx implica p,” l’affermazione di questa funzione significa “qualsiasi valore di φx implica che p ‘è vero,” non “‘ ogni valore di φx è vero ‘implica p.” In quest’ultimo, abbiamo realmente “tutti i valori di φx sono veri”, e la x è una variabile apparente.

* L’ambito di una variabile reale è l’intera funzione di cui “qualsiasi valore” è in questione. Così nella “φx implica p ” l’ambito di x non è φx, ma” φx implica p”.

III. 

Il significato e il campo delle Proposizioni Generalizzate. 

In questa sezione dobbiamo considerare dapprima il significato delle proposizioni in cui la parola tutto si presenta, e poi il tipo di raccolte che ammettono proposizioni riguardanti tutti i loro membri.

È conveniente dare il nome proposizioni generalizzate non solo a quelle che contengono tutto, ma anche a quelle che contengono qualche (non definito). La proposizione “φx è a volte vera” è equivalente alla negazione di “non-φx è sempre vero,” “qualche ‘A è B” è equivalente alla negazione di “tutti gli A non sono B;”, ovvero di “nessun A è B. “Se è possibile trovare le interpretazioni che contraddistinguono” φx è talvolta vera ” dalla negazione di” non-φx è sempre vero, “non è necessario fare indagini; per i nostri scopi possiamo definire” φx a volte è vero “, come la negazione di “non-φx è sempre vero.” In ogni caso, i due tipi di proposizioni richiedono lo stesso tipo di interpretazione, e sono soggette alle stesse limitazioni.

In ognuna vi è una variabile apparente; ed è la presenza di una variabile apparente che costituisce ciò che io intendo per una proposizione generalizzata. (Si noti che non può esistere una variabile reale in una qualsiasi proposizione; perché quello che contiene una variabile reale è una funzione proposizionale, non una proposizione-)

La prima domanda che dobbiamo porci in questa sezione è: Come dobbiamo interpretare la parola tutti in certe proposizioni come “tutti gli uomini sono mortali?” A prima vista, si potrebbe pensare che non ci sarebbe nessuna difficoltà, che “tutti gli uomini” sia  un’idea perfettamente chiara, e che diciamo di tutti gli uomini è che sono mortali. Ma su questo punto di vista ci sono molte obiezioni.

(1) Se questo punto di vista fosse corretto, sembrerebbe che “tutti gli uomini sono mortali” non sarebbe vero se non ci fossero uomini. Eppure, come il signor Bradley ha messo in evidenza, “I trasgressori saranno perseguiti” * può essere perfettamente vero anche se nessuno trasgredisce; e quindi, come egli sostiene ulteriormente, siamo spinti ad interpretare tali proposizioni come proposizioni ipotetiche, che significano “se qualcuno trasgredisce, sarà perseguito;” i. e., “se x trasgredisce, x sarà perseguito”, in cui la gamma di valori che x può avere, qualunque esso sia, non è certamente limitato a coloro che realmente trasgrediscono. Allo stesso modo “tutti gli uomini sono mortali” si intende “se x è un uomo, x è mortale, dove x può avere qualsiasi valore entro un certo intervallo.” Quale sia questo intervallo, resta da determinare; ma in ogni caso è più ampio di “uomini”, perché la proposizione ipotetica di cui sopra è certamente spesso vera quando x non è un uomo.

* Logica, Parte I, capitolo II.

(2) “Tutti gli uomini” è una locuzione denotativa; e sembrerebbe, per ragioni che ho esposte altrove, † che le locuzioni denotative non hanno alcun significato prese isolatamente, ma entrano solo come costituenti nell’espressione verbale di proposizioni che non contengono nessun componente corrispondente alle locuzioni denotative  in questione. Vale a dire, una locuzione denotativa è definito mediante le proposizioni in cui una espressione verbale si verifica. Quindi è impossibile che queste proposizioni acquisiscano il loro significato attraverso le locuzioni denotative; dobbiamo trovare un’interpretazione indipendente delle proposizioni contenenti tali locuzioni, e non deve utilizzare queste locuzioni per spiegare che cosa significano queste proposizioni. Quindi non possiamo considerare “tutti gli uomini sono mortali”, come una asserzione su “tutti gli uomini.”

† “On D”enoting. Mind, Ottobre 1905.

(3) Anche se ci fosse un certo oggetto come “tutti gli uomini”, è chiaro che non è questo l’oggetto a cui si attribuisce la mortalità quando diciamo “tutti gli uomini sono mortali.” Se stessimo attribuendo la mortalità a questo oggetto, dovremmo dire “ogni uomo è mortale.” Così l’ipotesi che esista un cero oggetto come “tutti gli uomini” non ci aiuta ad interpretare “tutti gli uomini sono mortali.”

(4) Sembra evidente che, se incontriamo qualcosa che può essere un uomo o può essere un angelo sotto mentite spoglie, si rientra nell’ambito di applicazione di “tutti gli uomini sono mortali” per affermare “se questo è un uomo, è mortale. “Così ancora una volta, come nel caso dei trasgressori, sembra chiaro che stiamo in realtà dicendo “se qualcuno è un uomo,esso è mortale”, e che la domanda se questo o quello è un uomo non rientra nell’ambito di applicazione della nostra affermazione, come avverrebbe se il tutto fosse riferito a “tutti gli uomini.”

(5) Arriviamo così al punto di vista che quello che si intende per “tutti gli uomini sono mortali” può essere più esplicitamente stabilito in una qualche forma come “è sempre vero che se x è un uomo, x è mortale.” Qui dobbiamo indagare sulla portata della parola sempre.

(6) È ovvio che sempre comprende alcuni casi in cui x non è un uomo, come abbiamo visto nel caso dell’angelo sotto mentite spoglie. Se x fosse limitato al caso in cui x è un uomo, si potrebbe dedurre che x è un mortale, poiché se x è un uomo, x è mortale. Quindi, con lo stesso significato di sempre, troveremmo “è sempre vero che x è mortale.” Ma è chiaro che, senza alterare il significato di sempre, questa nuova proposizione è falsa, anche se l’altra era vera.

(7) Si potrebbe sperare che “sempre” significhi “per tutti i valori di x.”

Ma “tutti i valori di x,” se legittima, dovrebbe includere come parti “tutte le proposizioni” e “tutte le funzioni”, e tali totalità illegittime. Quindi i valori di x devono essere in qualche modo limitati all’interno di alcuni totalità legittime. Ciò ci sembra condurre alla dottrina tradizionale di un “universo del discorso” entro cui x deve essere ritenuto che sia posto.

(8) Tuttavia, è abbastanza essenziale che dovremmo avere qualche significato di sempre, che non deve essere espresso in una ipotesi restrittiva come per x. Perché supponiamo che “sempre” significa “‘ogni volta che x appartiene alla classe i.” Allora “tutti gli uomini sono mortali” diventa “ogniqualvolta che x appartiene alla classe i, se x è un uomo, x è mortale ‘”, ovvero, «è sempre vero che se x appartiene alla classe i, allora, se x è un uomo, x è mortale.” Ma quale è il nostro significato del nuovo sempre? Non sembra che ci siano più ragioni per limitare x, in questa nuova proposizione, alla classe i, che c’erano prima per limitare alla classe dell’uomo. Così saremo portati a un nuovo universo più ampio, e così via all’infinito, a meno che non siamo in grado di scoprire qualche restrizione naturale sui possibili valori della (ad esempio, alcune restrizioni date con la) funzione “se x è un uomo, x è mortale , “e che non hanno bisogno di essere imposte dall’esterno.

(9) Sembra evidente che, dal momento che tutti gli uomini sono mortali, non ci può essere una qualsiasi proposizione falsa, che sia un valore della funzione “se x è un uomo, x è mortale.”

Perché se questa è una davvero una proposizione, l’ipotesi “x è un uomo” deve essere una proposizione, e così deve essere la conclusione “x è mortale.” Ma se l’ipotesi è falsa, l’ipotetica è vera; e se l’ipotesi è vera, l’ipotetica è vero.

Quindi ci possono essere false proposizioni nella forma “se x è un uomo, x è mortale.”

(10) Ne consegue che, se sono da escludere alcuni valori di x, possono essere solo i valori per i quali non vi è alcuna proposizione nella forma “se x è un uomo, x è mortale”, cioè, per cui questa frase è senza senso. Dal momento che, come abbiamo visto in (7), sono da escludere valori di x, ne consegue che la funzione “se x è un uomo, x è mortale” deve avere un certo campo di significato, * che è insufficiente per tutti i valori immaginabili di x, sebbene superi i termini che sono gli uomini. La restrizione su x è pertanto una restrizione sulla gamma di significato della funzione “se x è un uomo, x è mortale.”

  • Una funzione si dice che sia significativa per l’argomento x se ha un valore con questo argomento. Così possiamo dire in breve “φx è significativo,” che significa “la funzione φ ha un valore per l’argomento x.” L’area di significato di una funzione consiste di tutti i termini per i quali la funzione è vera, insieme a tutti i termini per cui è falsa.

(11) Si giunge quindi alla conclusione che “tutti gli uomini sono mortali” significa “se x è un uomo, x è mortale, sempre”, dove sempre significa”per tutti i valori della funzione ‘se x è un uomo, x è mortale . “‘Questa è una limitazione interna su x, data dalla natura della funzione; ed è una limitazione che non richiede una regola esplicita, poiché è impossibile per una funzione essere vera in modo più generale che per tutti i suoi valori. Inoltre, se il campo di significato della funzione è i, la funzione “se x è una i, allora se x è un uomo, x è mortale” ha lo stesso campo di significato, dal momento che non può essere significativa a meno che il suo costituente “se x è un uomo, x è mortale ” sia significativo. Ma qui il campo di significato è ancora implicito, come lo era in ‘se x è un uomo, x è mortale;’ quindi non possiamo costituire campi di significato espliciti, poiché il tentativo di farlo solo dà luogo ad una nuova proposizione in cui lo stesso campo di significato è implicito.

Così in generale: “. (x) φx” significa “φx sempre.” Questo può essere interpretato, anche se con meno esattezza, come “φx è sempre vero”, o, più esplicitamente: “Tutte le proposizioni della forma φx sono vere,” o “Tutti i valori della funzione φx sono veri.” † Così il fondamentale tutto è “tutti i valori di una funzione proposizionale,” ed ogni altro tutto è derivato da questo. Ed ogni funzione proposizionale ha un certo campo di significato, all’interno del quale si trovano gli argomenti per i quali la funzione ha dei valori. All’interno di questo campo di argomenti, la funzione è vera o falsa; fuori di questo intervallo, è un nonsenso.

† Una adatta espressione linguistica espressione di questa idea è: “φx è vero per tutti i possibili valori di x,” un possibile valore essendo inteso come quello per il quale φx ha significato.

L’argomentazione di cui sopra può essere sintetizzata come segue:

La difficoltà che affligge i tentativi di limitare la variabile è, che le restrizioni naturalmente si esprimono come ipotesi che la variabile è di un tale o di un tal altro genere, e che, quando così espressa, l’ipotetico risultato è esente dalla restrizione prevista. Ad esempio, tentiamo di limitare la variabile agli uomini, e affermare che, sotto tale restrizione, “, x è mortale” è sempre vero. Allora quello che è sempre vero è che se x è un uomo, x è mortale; e questa ipotesi vale anche quando x non è un uomo. Così una variabile non può mai essere limitato entro un certo intervallo se la funzione proposizionale in cui si verifica la variabile rimane significativa quando la variabile è fuori di tale intervallo. Ma se la funzione cessa di avere significato quando la variabile va fuori di un certo intervallo, allora la variabile è ipso facto limitata a tale intervallo, senza la necessità di alcuna regola esplicita in tal senso. Questo principio è da tenere presente nello sviluppo di tipi logici, a cui si procederà tra breve.

Ora possiamo cominciare a vedere come avviene che “tutto è così-e-così” è a volte una frase legittima e talvolta no. Supponiamo che diciamo “tutti i termini che hanno la proprietà φ hanno la proprietà ψ.” Questo significa che, secondo l’interpretazione di cui sopra, “φx implica sempre ψx.” A condizione che la gamma di significatività del φx sia la stessa di quella di ψx, questa affermazione è significativa; quindi, data una qualsiasi definita funzione φx, esistono proposizioni su “tutti i termini che soddisfano φx.”

Ma a volte capita (come vedremo meglio in seguito) che ciò che appare verbalmente come una funzione è in realtà molte funzioni analoghe con diversi campi di significato. Ciò si applica, per esempio, a “p è vero”, che, scopriremo, non è in realtà una funzione di p, ma è diverse funzioni a seconda del tipo di proposizione che sarà p. In tal caso, la frase che esprime la funzione ambigua può, a causa della ambiguità, essere significativa per tutta una serie di valori dell’argomento che eccede l’intervallo di significatività di una qualsiasi funzione. In tal caso, non tutto è legittima. Quindi se proviamo a dire “tutte le proposizioni vere hanno la proprietà φ,” ovvero “‘p’ vero ‘implica sempre φp,” i possibili argomenti di’ p è vero ‘necessariamente superano i possibili argomenti per φ, e quindi il tentativo di una regola generale è impossibile. Per questo motivo, vere regole generali su tutte le proposizioni vere non possono essere costruite. Può accadere, tuttavia, che la supposta funzione φ è davvero ambigua come ‘p è vera;’ e se capita di avere una ambiguità esattamente dello stesso tipo di quella di ‘p è vero,’ potremmo essere in grado sempre di dare un’interpretazione alla proposizione “‘p è vero’ implica φp.” Questo si verificherà, ad esempio, se φp è “non-p è falsa.” Così otteniamo un apparenza, in tali casi, di una proposizione generale riguardante tutte le proposizioni; ma questa apparenza è dovuta ad una ambiguità sistematica su parole come vero e falso. (Questa ambiguità sistematica deriva dalla gerarchia delle proposizioni che verrà spiegata più avanti). Possiamo, in tutti questi casi, porre la nostra regola su qualsiasi proposizione, dal momento che il significato delle parole ambigue si adatterà a qualsiasi proposizione. Ma se volgiamo la nostra proposizione in una variabile apparente, e diciamo qualcosa su tutto, dobbiamo supporre le parole ambigue fissate a questo o quel possibile significato, anche se può essere abbastanza irrilevante quale dei loro possibili significati debbano avere. Questo è quanto succede sia che tutto abbia dei limiti che escludono “tutte le proposizioni,” e che ci sembrano comunque essere affermazioni vere su “tutte le proposizioni.” Entrambi questi punti diventeranno più chiari quando la teoria dei tipi sarà stata spiegata.

Si è spesso ipotizzato * che ciò che è richiesto in modo che possa essere legittimo parlare di tutto di un insieme sia che l’insieme dovrebbe essere finita.

Così “tutti gli uomini sono mortali” sarà legittimo perché gli uomini formano una classe finita.

Ma questo non è davvero il motivo per cui possiamo parlare di “tutti gli uomini.” Quello che è essenziale, come risulta dalla discussione di cui sopra, non è finitezza, ma quello che può essere chiamato l’omogeneità logica. Questa proprietà è di appartenere a qualsiasi insieme i cui termini sono tutti contenuti all’interno del campo di significato di una qualche funzione.

Sarebbe sempre evidente a colpo d’occhio se un insieme contenga questa proprietà o no, se non fosse per l’ambiguità nascosta nei termini logici comuni come vero e falso, che conferiscono un aspetto di essere una sola funzione a ciò che è veramente un agglomerato di molte funzioni con diversi intervalli di significato.

Le conclusioni di questa sezione sono le seguenti: ogni proposizione contenente tutto afferma che una qualche funzione proposizionale è sempre vera; e questo significa che tutti i valori di detta funzione sono veri, non che la funzione è vera per tutti gli argomenti, dal momento che ci sono argomenti per i quali una determinata funzione è priva di significato, ovvero, non ha alcun valore. Quindi si può parlare di tutto di un insieme quando e solo quando l’insieme forma parte di tutto l’insieme del campo di significato di una qualche funzione proposizionale, l’intervallo di significatività essendo definito come l’insieme di quegli argomenti per cui la funzione in questione è significativa , ovvero, ha un valore.

* E. g., M. Poincaré, Revue de Métaphysique et de Morale, Mai 1906.

IV. 

La Gerarchia dei tipi. 

Un tipo è definito come l’intervallo di significatività di una funzione proposizionale, i. e., come l’insieme degli argomenti per cui detta funzione ha valori.

Ogni volta che si presenta una variabile apparente in una proposizione, l’intervallo dei valori della variabile apparente è un tipo, il tipo essendo fissato dalla funzione per cui “tutti i valori” sono interessati. La divisione degli oggetti in tipi è resa necessaria dalle fallacie riflessive che altrimenti si presentano. Questi errori, come abbiamo visto, sono da evitare da quello che può essere chiamato il “principio del circolo vizioso;” cioè  “nessuna totalità può contenere membri definiti in termini di sé stesso”. Questo principio, nel nostro linguaggio tecnico, diventa: “Qualunque cosa contenga una variabile apparente non deve essere un possibile valore di tale variabile.” Così qualunque cosa contenga una variabile apparente deve essere di un tipo diverso dai possibili valori di quella variabile; diremo che si tratta di un tipo più elevato. Così le variabili apparenti contenute in una espressione sono ciò che determina il suo tipo. Questo è il principio guida nel seguito.

Le proposizioni che contengono le variabili apparenti sono generati da quelle che non contengono queste variabili apparenti da processi di cui uno è sempre il processo di generalizzazione,ovvero, la sostituzione di una variabile in uno dei termini di una proposizione, e l’affermazione della funzione risultante per tutti i possibili valori della variabile. Quindi una proposizione è chiamata proposizione generalizzata quando contiene una variabile apparente. Chiameremo una proposizione che non contenga nessuna variabile apparente una proposizione elementare. E’ chiaro che una proposizione contenente una variabile apparente presuppone altre da cui può essere ottenuta per generalizzazione; quindi tutte le proposizioni generalizzate presuppongono proposizioni elementari. In una proposizione elementare possiamo distinguere uno o più termini da uno o più concetti; i termini sono tutto ciò che può essere considerato come il soggetto della proposizione, mentre i concetti sono i predicati o relazioni affermate da questi termini * Chiameremo i termini di proposizioni elementari particolari; questi costituiscono il primo o tipo di più basso livello.

* Vedi Principles of di Mathematics, § 48.

Non è necessario, in pratica, sapere quali oggetti appartengano al tipo di più basso livello, o anche se il tipo di variabile più basso che si presenta in un determinato contesto è quello di particolari o qualche altra cosa. Perché in pratica solo i tipi relativi alle variabili sono rilevanti; così il tipo più basso che si verifica in un determinato contesto può essere chiamato quello dei particolari, per quanto tale contesto è interessato. Ne consegue che la considerazione di cui sopra dei particolari non è essenziale alla verità di ciò che segue; tutto ciò che è essenziale è il modo in cui altri tipi sono generati da particolari, in qualsiasi modo il tipo di particolari possa essere costituito.

Applicando il processo di generalizzazione ai particolari che si presentano in proposizioni elementari, otteniamo nuove proposizioni. La legittimità di questo processo richiede solo che nessun particolare sia una proposizione. Che questo sia così, sarà assicurato dal significato che diamo alla parola particolare. Possiamo definire un particolare come qualcosa privo di complessità; non è quindi ovviamente una proposizione, poiché le proposizioni sono fondamentalmente complesse. Quindi, nell’applicare il processo di generalizzazione ai particolari non corriamo alcun rischio di incorrere in errori riflessivi.

Chiameremo proposizioni del primo ordine le proposizioni elementari insieme con quelle che contengono solo particolari come variabili apparenti. Queste costituiscono il secondo tipo logico.

Abbiamo così una nuova totalità, quella delle proposizioni del primo ordine. Possiamo quindi formare nuove proposizioni in cui proposizioni di primo ordine si verificano come variabili apparenti. Chiameremo queste proposizioni del secondo ordine; queste costituiscono il terzo tipo logico. Così, ad esmpio, se Epimenide afferma “tutte le proposizioni del primo ordine affermate da me sono false”, asserisce una proposizione del secondo ordine; egli può asserire questo veramente, senza asserire in verità alcuna proposizione del primo ordine, e quindi si pone alcuna contraddizione.

Il suddetto processo può essere continuato all’infinito. L’n + 1 esimo tipo logico sarà costituito da proposizioni di ordine n, che saranno tali da contenere proposizioni di ordine n – 1, ma nessuna di ordine superiore, come variabili apparenti. I tipi così ottenuti sono mutuamente esclusivi, e quindi non sono possibili fallacie riflessive purché ci ricordiamo che una variabile apparente deve essere sempre confinata all’interno di un certo tipo.

In pratica, una gerarchia di funzioni è più utile di una di proposizioni. Funzioni di vari ordini possono essere ottenute da proposizioni di vari ordini con il metodo della sostituzione. Se p è una proposizione, e a un costituente di p, assumiamo che “p / a; x” indichi la proposizione che deriva dalla sostituzione di x con αa ovunque a si verifica in p. Allora p / a, che chiameremo una matrice, può prendere il posto di una funzione; il suo valore per l’argomento x è p / a α; x, e il suo valore per l’argomento a è p. Allo stesso modo, se “p / (a, b); (x, y)” indica il risultato della prima sostituendo x con a e quindi sostituendo y con b, possiamo utilizzare la matrice doppia p / (α, b) per rappresentare un funzione doppia. In questo modo possiamo evitare variabili apparenti diverse dai particolari e le proposizioni di vari ordini.

L’ordine di una matrice viene definita come l’ordine della proposizione in cui la sostituzione è effettuata, proposizione che chiameremo il prototipo.

L’ordine di una matrice non determina il tipo: in primo luogo perché non determina il numero di argomenti con cui gli altri devono essere sostituiti (cioè, se la matrice è della forma p / a o p / a, b ) o p / (a, b, c), ecc.); in secondo luogo, perché, se il prototipo è più elevato del primo ordine, gli argomenti possono essere sia proposizioni sia particolari. Ma è chiaro che il tipo di matrice è sempre definibile mediante la gerarchia delle proposizioni.

Anche se è possibile sostituire funzioni con matrici, e anche se questa procedura introduce una certa semplicità nella spiegazione dei tipi, è tecnicamente scomodo. Tecnicamente, è utile sostituire il prototipo p con φa, e sostituire p/a; x con φx; così dove, se venissero impiegate le matrici, p e a apparirebbero come variabili apparenti, ora abbiamo φ come la nostra variabile apparente. Affinché φ possa essere legittima come variabile apparente, è necessario che i suoi valori siano limitati a proposizioni di un certo tipo.

Quindi si procede come segue.

Una funzione il cui argomento è un particolare e il cui valore è sempre una proposizione del primo ordine sarà chiamata funzione del primo ordine. Una funzione che riguarda una funzione di primo ordine o una proposizione come variabile apparente sarà chiamata una funzione di secondo ordine, e così via. Una funzione di una variabile che è dell’ordine immediatamente superiore a quello dei suoi argomenti sarà chiamata funzione predicativa; lo stesso nome sarà dato ad una funzione di più variabili se esiste tra queste variabili una variabile per cui la funzione diventa predicativa quando i valori sono assegnati a tutte le altre variabili. Allora il tipo di una funzione viene determinata dal tipo dei suoi valori e il numero e dal tipo dei suoi argomenti.

La gerarchia delle funzioni può essere ulteriormente spiegata come segue. Una funzione di primo ordine di un particolare x sarà indicata con φ! x (le lettere ψ, χ, θ, f, g, F, G saranno utilizzate anche per le funzioni). Nessuna funzione di primo ordine contiene una funzione come variabile apparente; quindi tali funzioni costituiscono una totalità ben definita, e la φ in φ! x può essere trasformato in una variabile apparente. Ogni proposizione in cui φ appare come variabile apparente, e non vi è alcuna variabile apparente di tipo superiore a φ, è una proposizione del secondo ordine. Se tale proposizione contiene un particolare x, non è una funzione predicativa di x; ma se contiene una funzione di primo ordine φ, si tratta di una funzione predicativa di φ, e sarà  scritta Schermata 2014-09-21 alle 19.17.04

Allora f è una funzione predicativa del secondo ordine; i possibili valori di f di nuovo formano una totalità ben definita, e possiamo trasformare f in una variabile apparente. Possiamo quindi definire le funzioni predicative terzo ordine, che saranno tali da avere proposizioni del terzo ordine per i loro valori e funzioni predicative del secondo ordine per i loro argomenti. E in questo modo possiamo continuare all’infinito. Uno sviluppo esattamente simile vale per funzioni di più variabili.

Adotteremo le seguenti convenzioni. Le variabili del tipo più basso che si verificano in qualsiasi contesto saranno indicate con lettere minuscole latine (escluse f e g, che sono riservati alle funzioni); una funzione predicativa di un argomento x (dove x può essere di qualsiasi tipo) verrà indicato con φ! x (dove ψ, χ, θ, f, g, F o G possono sostituire φ); allo stesso modo una funzione predicativa di due argomenti x e y sarà indicata con φ! (x, y); una funzione generale di x sarà indicata con φ x, e una funzione generale di x e y da φ (x, y). In φx, φ non può essere costituita da una variabile apparente, dal momento che il suo tipo è indeterminato; ma in φ! x, dove φ è una funzione predicativa il cui argomento è di qualche tipo assegnato, φ può essere costituita da una variabile apparente.

E‘ importante osservare che, poiché ci sono vari tipi di proposizioni e funzioni, e dal momento che la generalizzazione può essere applicata solo all’interno di un determinato tipo, tutte le frasi che contengono le parole “tutte le proposizioni” o “tutte le funzioni” sono a prima vista senza significato, anche se in alcuni casi sono suscettibili di una interpretazione ineccepibile. Le contraddizioni nascono dall’uso di tali frasi nel caso in cui nessun significato semplice può essere trovato.

Se ora ritorniamo alle contraddizioni, vediamo subito che alcuni di esse sono risolte con la teoria dei tipi. Ovunque si parla di ”tutte le proposizioni”, dobbiamo sostituire “tutte le proposizioni di ordine n”, dove è indifferente che valore diamo alla n, ma è essenziale che n deve avere un qualche valore. Così, quando un tale dice “Io sto mentendo,” dobbiamo interpretarlo nel senso: “C’è una proposizione di ordine n, che io affermo, e che è falsa.” Questa è una proposizione di ordine n + 1; quindi l’uomo non sta affermando una qualsiasi proposizione di ordine n; quindi la sua affermazione è falsa, e tuttavia la sua falsità non implica, come quella di “Io sto mentendo” è apparso implicarlo, che sta facendo un’affermazione vera. Questo risolve la contraddizione del mentitore.

Si consideri poi “il minimo intero non nominabile in meno di diciannove sillabe.” E ‘da osservare, in primo luogo, che nominabile deve significare “nominabile per mezzo di tali e tali nomi assegnati”, e che il numero di nomi assegnati deve essere finito. Perché se non è finito, non c’è motivo per cui ci dovrebbe essere un numero intero non nominabile in meno di diciannove sillabe, e il paradosso crollerebbe. Possiamo subito dopo supporre che il  “nominabile in termini di nomi della classe N” significa “essere l’unico termine che soddisfa una qualche funzione composta interamente di nomi della classe N. ” La soluzione di questo paradosso sta, credo, nella semplice constatazione che” nominabile nei termini dei nomi della classe N “non è mai in sé nominabile nei termini dei nomi di quella classe. Se allarghiamo N aggiungendo il nome “nominabile in termini dei nomi della classe N,” il nostro apparato fondamentale dei nomi viene ingrandito; chiamando il nuovo apparato N ‘, “nominabile nei termini dei nomi della classe N’ ” rimane non nominabile in termini dei nomi della classe N’. Se proviamo a ingrandire N fino a che abbracci tutti i nomi, “nominabile” diventa (da quanto si è detto sopra) “ essere l’unico termine che soddisfa una qualche funzione composta interamente di nomi.” Ma qui c’è una funzione come variabile apparente; quindi siamo confinati a funzioni predicative di un certo tipo (perché le funzioni non-predicative non possono essere variabili apparenti). Quindi dobbiamo solo osservare che la nominabilità nei termini di tali funzioni è non-predicativa per sfuggire il paradosso.

Il caso del “minimo ordinale indefinibile” è strettamente analogo al caso che abbiamo appena discusso. Qui, come prima, “definibile” deve essere relativo a qualche dato apparato di idee fondamentali; e non vi è motivo di ritenere che “definibile in termini di idee della classe N” non sia definibile in termini delle idee della classe N. Sarà vero che c’è qualche segmento definito della serie di ordinali interamente costituito di ordinali definibili, e aventi il minimo ordinale indefinibile come limite. Questo minimo ordinale indefinibile sarà definibile da un leggero allargamento del nostro apparato fondamentale; ma vi sarà poi un nuovo ordinale che sarà il minimo indefinibile con il nuovo apparato. Se allarghiamo il nostro apparato in modo da includere tutte le idee possibili, non c’è più alcun motivo per credere che non vi sia nessun ordinale indefinibile. La forza apparente del paradosso risiede in gran parte, credo, nella supposizione che, se tutti gli ordinali di una certa classe sono definibili, la classe deve essere definibile, nel qual caso il suo successore è, naturalmente, anche definibile; ma non vi è alcuna ragione per accettare questa ipotesi.

Le altre contraddizioni, quella di Burali-Forti, in particolare, richiedono alcuni ulteriori sviluppi per la loro soluzione.

V. 

L’Assioma di Riducibilità.

Una funzione proposizionale di x può, come abbiamo visto, essere di qualsiasi ordine; quindi qualsiasi asserzione su “tutte le proprietà di x” è priva di significato. (Una “proprietà di x” è la stessa cosa come una “funzione proposizionale che detiene quelle di x.”), Ma è assolutamente necessario, se la matematica deve essere possibile, che dovremmo avere qualche metodo di fare affermazioni che di solito sono equivalenti a ciò che abbiamo in mente quando (in modo impreciso) parliamo di “tutte le proprietà di x.” Questa necessità si verifica in molti casi, ma soprattutto in relazione all’induzione matematica.

Possiamo dire, con l’uso di qualsiasi al posto del tutto, “Qualsiasi proprietà posseduta da 0, e dai successori di tutti i numeri che la possiedono, è posseduta da tutti i numeri finiti.” Ma non possiamo andare avanti fino a: “. Un numero finito è un numero che possiede tutte le proprietà possedute da 0 e dai successori di tutti i numeri che li possiedono” Se limitiamo questa affermazione a tutte le proprietà del primo ordine dei numeri, non possiamo dedurre che essa contiene delle proprietà del secondo ordine. Ad esempio, saremo in grado di dimostrare che, se m, n sono numeri finiti, allora m + n è un numero finito.

Infatti, con la definizione di cui sopra, “m è un numero finito” è una proprietà di secondo ordine di m; quindi il fatto che m + 0 è un numero finito, e che, se m + n è un numero finito, così sarà m + n + 1, non consente di concludere per induzione che m + n è un numero finito. È evidente che un simile stato di cose rende molto della matematica elementare impossibile.

L’altra definizione di finitezza, per la non-somiglianza di tutto e parte, non andrebbe meglio. Perché questa definizione è: “Una classe si dice finita quando ogni relazione biunivoca il cui dominio è la classe e il cui dominio inverso è contenuto nella classe ha tutta la classe per suo dominio inverso.” Qui viene visualizzata una relazione variabile, ovvero, una funzione variabile di due variabili; dobbiamo prendere tutti i valori di questa funzione, che richiede che sia di un qualche ordine assegnato; ma qualsiasi ordine assegnato non ci permetterà di dedurre molte delle proposizioni della matematica elementare.

Quindi dobbiamo trovare, se possibile, un qualche metodo per ridurre l’ordine di una funzione proposizionale senza alterare la verità o la falsità dei suoi valori.

Questo sembra essere ciò che il senso comune attua con l’accettazione delle classi. Data una qualsiasi funzione proposizionale φx, di qualsiasi ordine, questa si presume che sia equivalente, per tutti i valori di x, ad una affermazione del tipo “x appartiene alla classe α.” Ora, questa affermazione è del primo ordine, in quanto non fa alcuna allusione a “tutte le funzioni di tale e talaltro tipo.” Infatti il suo unico vantaggio pratico sull’affermazione originale φx è che è del primo ordine. Non vi è alcun vantaggio nel ritenere che in realtà ci sono oggetti come le classi, e la contraddizione sulle classi che non sono membri di se stesse dimostra che, se ci sono classi, devono essere qualcosa di radicalmente diverso dai particolari. Credo che lo scopo principale a cui servono le classi, e la ragione principale che le rende linguisticamente utili, è che esse forniscono un metodo per ridurre l’ordine di una funzione proposizionale. Io, dunque, non presumo nulla di quello che può sembrare di essere coinvolto nella ammissione del senso comune delle classi, tranne questo: che ogni funzione proposizionale è equivalente, per tutti i suoi valori, a qualche funzione predicativa.

Questa ipotesi per quanto riguarda le funzioni deve essere presa qualunque sia il tipo dei loro argomenti. Sia φx  una funzione, di qualsiasi ordine, di un argomento x, che può essere esso stesso un particolare o una funzione di qualsiasi ordine.

Se φ è di ordine successivo al di sopra di x, scriviamo la funzione nella forma φ! x; in tal caso chiameremo φ funzione predicativa. Così una funzione predicativa di un particolare è una funzione del primo ordine; e per tipi superiori di argomenti, le funzioni predicative prendono il posto che le funzioni del primo ordine prendono nei confronti dei particolari​​. Assumiamo, quindi, che ogni funzione è equivalente, per tutti i suoi valori, a qualche funzione predicativa dello stesso argomento. Questa ipotesi sembra essere l’essenza della consueta ipotesi di classi; in ogni caso, essa conserva il maggior numero di classi che abbiamo per qualsiasi uso, e un numero piccolo abbastanza per evitare le contraddizioni che una ammissione meno riluttante sulle classi è suscettibile di comportare. Chiameremo questa ipotesi l’assioma delle classi, o l’assioma di riducibilità.

Noi ipotizzeremo analogamente che ogni funzione di due variabili è equivalente, per tutti i suoi valori, ad una funzione predicativa di tali variabili, dove una funzione predicativa di due variabili è una funzione tale che esista una delle variabili per la quale la funzione diventa predicativo (nel nostro senso precedente indicato) quando un valore viene assegnato all’altra variabile. Questa ipotesi è ciò che sembra significativo nel dire che qualsiasi affermazione circa due variabili definisce una relazione tra di loro. Chiameremo questa ipotesi l’assioma delle relazioni o l’assioma di riducibilità.

Nel trattare con le relazioni tra più di due termini, sarebbero necessarie assunzioni simili per tre, quattro, … variabili. Ma queste ipotesi non sono indispensabili per il nostro scopo, e non sono quindi considerate in questo documento.

Con l’aiuto dell’assioma di riducibilità, affermazioni su “tutte le funzioni del primo ordine di x” o “tutte le funzioni predicative di α” determina la maggior parte dei risultati che altrimenti richiederebbe “tutte le funzioni.” Il punto essenziale è che tali risultati si ottengono in tutti i casi in cui solo la verità o la falsità dei valori delle funzioni in questione sono rilevanti, come è sempre il caso in matematica.

Così l’induzione matematica, per esempio, serve ora ad essere stabilita solo per tutte le funzioni predicative di numeri; segue poi dall’assioma delle classi che appartiene a qualsiasi funzione di qualunque ordine. Si potrebbe pensare che i paradossi per il bene dei quali abbiamo inventato la gerarchia dei tipi ricomparirebbe ora. Ma questo non è il caso, in quanto, in tali paradossi, o è rilevante qualcosa che va oltre la verità o la falsità dei valori delle funzioni, o si verificano espressioni che sono senza significato, anche dopo l’introduzione dell’assioma di riducibilità.

Ad esempio, una certa dichiarazione come “Epimenide afferma ψx” non equivale a “Epimenide afferma φ! x”, anche se ψx e φ! x sono equivalenti.

Così “Io sto mentendo” resta senza significato se cerchiamo di includere tutte le proposizioni tra quelle che io posso essere in errore affermandole, e non è influenzato dall’assioma delle classi se ci limitiamo a proposizioni di ordine n. La gerarchia delle proposizioni e delle funzioni, quindi, rimane importante in soli quei soli casi in cui vi è un paradosso da evitare.

VI. 

Idee primitive e proposizioni della logica simbolica. 

Le idee primitive richieste in logica simbolica sembrano essere le seguenti sette:

(1) Qualsiasi funzione proposizionale di una variabile x o di più variabili x, y, z,. . . Questo sarà indicato con φx o φ (x, y, z,..)

(2) La negazione di una proposizione. Se p è la proposizione, la sua negazione sarà indicata con ~p.

(3) La disgiunzione o somma logica di due proposizioni; i. e. “questo o quello”.

Se p, q sono le due proposizioni, la loro disgiunzione sarà indicato con p V q. *

* In un precedente articolo di questa rivista, ho assunto l’implicazione come indefinibile, invece della disgiunzione. La scelta tra e due è una questione di gusti; Ora scelgo la disgiunzione, perché ci permette di diminuire il numero di proposizioni primitive.

(4) La verità di qualsiasi valore di una funzione proposizionale; ovvero, di φx dove x  non è specificato.

(5) La verità di tutti i valori di una funzione proposizionale. Questa è indicata con (x). φx o (x): φx o qualunque numero maggiore di punti possano essere necessari per mettere tra parentesi la proposizione † In (x).. φx, x si chiama variabile apparente, mentre quando φx è asserito, dove x non viene specificato, x è detta variabile reale.

† L’uso dei punti segue l’uso di Peano. E ‘completamente spiegato da Whitehead, “On Cardinals numbers,” American Journal of Mathematics, vol. XXIV, e “On Mathematical Concepts of the Material World”, Phil. Trans. A., vol. CCV, pag. 472.

(6) Qualsiasi funzione predicativa di un argomento di qualsiasi tipo; questa sarà rappresentata da φ! x o φ! α o φ! R, secondo le circostanze. Una funzione predicativa di x è una funzione i cui valori sono proposizioni del tipo successivi superiori a quelli di x, se x è un particolare o una proposizione, o quello dei valori di x se x è una funzione. Essa può essere descritta come una funzione in cui le variabili apparenti, se presenti, sono tutti dello stesso tipo o di tipo inferiore ad x; ed una variabile è di tipo inferiore ad x se può presentarsi  significativamente come argomento di x, o come argomento di un argomento di x, ecc.

(7) Asserzione; ovvero, l’affermazione che qualche proposizione è vera, o che qualsiasi valore di una funzione proposizionale è vero. Questo è necessario per distinguere una proposizione effettivamente asserita da una proposizione su cui si sta solo riflettendo, o da una proposizione citata come ipotesi per qualche altra cosa. Ciò sarà indicato dal segno “⊦ ” messo davanti a quanto affermato, con abbastanza punti per mettere tra parentesi ciò che si afferma. *

* Questo segno, così come l’introduzione del concetto che esprime, sono dovuti a Frege. Vedere il suo Begriffsschrift (Halle, 1879), p. 1, e Grundgesetze der Arithmetik, vol. I (Jena, 1893), p. 9.

Prima di procedere alle proposizioni primitive, abbiamo bisogno di alcune definizioni.

Nelle seguenti definizioni, nonché nelle proposizioni primitive, le lettere p, q, r sono utilizzate per  indicare proposizioni.

Schermata 2014-09-21 alle 20.15.20

Questa definizione stabilisce che “p ⊃ q” (che si legge “p implica q”) è il significato di “p è falsa o q è vera.” Non intendo affermare che “implica” non può avere qualsiasi altro significato, ma solo che questo significato è quello che è più conveniente dare a “implica” nella logica simbolica. In una definizione, il segno di uguaglianza e le lettere “Df” devono essere considerati come un solo simbolo, che significa congiuntamente “è definito per significare.” Il segno di uguaglianza senza le lettere “Df” ha un significato diverso, da definire a breve.

Schermata 2014-09-21 alle 20.18.59

 

Questo definisce il prodotto logico di due proposizioni p e q, ovvero che “p e q sono entrambe vere.” La definizione di cui sopra stabilisce che questo sta a significare: “. E ‘falso che o p sia falsa o che q sia falsa” Anche in questo caso, la definizione non dà l’unico significato che può essere dato a “p e q sono entrambe vere”, ma dà il senso che è più conveniente per i nostri scopi.

Schermata 2014-09-21 alle 20.20.54

 

Cioè, “p ≣ q”, che si legge “p è equivalente a q,” significa “p implica q e q implica p;” dove,  naturalmente, ne segue che p e q sono entrambi veri o entrambi falsi.

Schermata 2014-09-21 alle 20.23.17

 

 

Questo definisce che “vi è almeno un valore di x per cui φx è vero.” Noi lo definiamo nel senso “è falso che φx è sempre falso.”

Schermata 2014-09-21 alle 20.24.48

 

Questa è la definizione di identità. Essa afferma che x e y devono essere considerati identici quando ogni funzione predicativa soddisfatta da x è soddisfatta da y. Ne consegue dall’assioma di riducibilità che se x soddisfa ψx, dove ψ è una qualsiasi funzione, predicativa o non-predicativa, allora y soddisfa ψy.

Le seguenti definizioni sono meno importanti, e vengono introdotte al solo scopo di abbreviazione.

Schermata 2014-09-21 alle 20.26.24

 

 

 

 

e così via per qualsiasi numero di variabili.

Le proposizioni primitive richieste sono le seguenti. (In 2, 3, 4, 5, 6, e 10, p, q, r stanno per  proposizioni.)

Schermata 2014-09-21 alle 20.28.44

ovvero, “se tutti i valori di

Schermata 2014-09-21 alle 20.30.59

 

 

sono veri, allora φy è vero, dove φy è un qualsiasi valore.” *

* E ‘conveniente utilizzare la notazione   Schermata 2014-09-21 alle 20.30.59       per indicare la funzione stessa, rispetto a questo o quel valore della funzione.

(8) Se φy è vero, dove φy è un qualsiasi valore di Schermata 2014-09-21 alle 20.30.59, allora (x) .φx è vero. Questo non può essere espresso con i nostri simboli; perché se scriviamo “φy. ⊃. (x). φx”, che significa “φy implica che tutti i valori di  Schermata 2014-09-21 alle 20.30.59sono veri, dove y potrebbe avere qualsiasi valore del tipo appropriato,” che non è, in generale, il caso. Quello che intendiamo affermare è: “Se, comunque si scelga y, φy è vero, allora (x). xφ è vero, “mentre ciò che è espresso da” φy. ⊃. (x). φx “è:” Comunque y venga scelto, se φy è vero, allora (x). φx è vero “, che è un’affermazione molto diversa, e in generale una affermazione falsa.

(9) ⊦: (x) .φx. ⊃. φa, dove α è una qualsiasi costante definita.

Questo principio è davvero come tanti principi diversi quanti sono i possibili valori di a. Ovvero, esso afferma che, ad esempio, qualunque cosa sia posseduto da tutti gli individui appartiene a Socrate; inoltre che appartiene a Platone; e così via. È il principio che una regola generale può essere applicata ai casi particolari; ma al fine di darne un’applicazione, è necessario citare i casi particolari, perché altrimenti abbiamo bisogno del principio stesso per assicurarci che la regola generale che le regole generali possono essere applicate a casi particolari può essere applicato (diciamo) al caso particolare di Socrate. È così che questo principio differisce dalla (7); il nostro principio attuale fa una affermazione su Socrate, o su Platone, o qualche altra costante definita, mentre la (7) ha fatto una affermazione su di una variabile.

Il principio di cui sopra non viene mai utilizzato nella logica simbolica o matematica pura, dal momento che tutte le nostre proposizioni sono generali, e anche se non (come in “uno è un numero”) ci sembra di avere un caso assolutamente particolare, questo risulta non essere così quando esaminato da vicino. infatti, l’applicazione del principio di cui sopra è il segno distintivo della matematica applicata. Quindi, a rigor di termini, potremmo doverla omettere dalla nostra lista.

Schermata 2014-09-21 alle 20.37.38

ovvero, “se ‘p o φx è sempre vero, allora o p è vera, o φx è sempre vera.”

(11) Quando f (φx) è vero per qualsiasi argomento di x possa essere, e F (φy) è vero per qualsiasi possibile argomento di y possa esserci, allora {f (φx). F (φx)} è vero per qualsiasi possibile argomento di x possa esserci.

Questo è l’assioma della “identificazione di variabili.” E’ necessario quando due distinte funzioni proposizionali sono ciascuna nota per essere sempre vere, e vogliamo dedurre che il loro prodotto logico è sempre vero. Questa deduzione è legittima solo se le due funzioni accettano argomenti dello stesso tipo, altrimenti il loro prodotto logico è privo di significato. Nell’assioma di cui sopra, x e y devono essere dello stesso tipo, perché entrambi si verifichino come argomenti di φ.

(12) Se φx. φx ⊃ ψx è vera per qualsiasi possibile x, allora ψx è vera per ogni possibile x.

Questo assioma è necessario per assicurarci che l’intervallo di validità di ψx, nel caso supposto, è lo stesso di quello di φx. φx ⊃ ψ x. ⊃. ψx; entrambi sono infatti dello stesso di φx. Sappiamo che, nel caso supposto, che ψx è vero ogni volta che φx. φx ⊃ ψ x e φx. φx ⊃ ψx. ⊃. ψx hanno entrambi significato, ma non sappiamo, senza un assioma, che ψx è vero ogniqualvolta che ψx ha significato. Da qui la necessità di un assioma.

Gli assiomi (11) e (12) sono necessari, ad esempio, a dimostrare

Schermata 2014-09-21 alle 20.40.56

Dalla (7) e (11),

Schermata 2014-09-21 alle 20.41.58

donde da (12),

Schermata 2014-09-21 alle 20.43.05

donde il risultato segue dalla (8) e (10).

Schermata 2014-09-21 alle 20.44.20

Questo è l’assioma di riducibilità. Esso afferma che, data un qualsiasi funzione Schermata 2014-09-21 alle 20.30.59esiste una funzione predicativa Schermata 2014-09-21 alle 20.46.17

tale che f! x è sempre equivalente a φx.

Si noti che, dal momento che una proposizione che inizia con “(∃f)” è, per definizione, la negazione di una proposizione che inizia con “(f),” l’assioma di cui sopra comporta la possibilità di considerare “tutte le funzioni predicative di x.” Se φx è una qualsiasi funzione di x, non possiamo costruire proposizioni che iniziano con “(φ)” o “(∃φ),” dato che non possiamo prendere in considerazione “tutte le funzioni,” ma solo “qualsiasi funzione” o “tutte le funzioni predicative.”

Schermata 2014-09-21 alle 20.48.04

Questo è l’assioma di riducibilità per le funzioni doppie.

Nelle proposizioni sopra riportate, le nostre x e y possono essere di di qualsiasi tipo quale che sia. L’unico modo in cui la teoria dei tipi è pertinente è quello solo (11) che ci permette di identificare variabili reali che si verificano in vari contenuti quando si dimostri essere dello stesso tipo per entrambi che si presentano come argomenti per la stessa funzione, e che, in (7) e (9), y e a devono essere rispettivamente del tipo appropriato per gli argomenti di  Schermata 2014-09-21 alle 20.49.19

Così, per esempio, supponiamo di avere una proposizione della forma  Schermata 2014-09-21 alle 20.50.24 che è una funzione di secondo ordine di x. Allora per la (7),

Schermata 2014-09-21 alle 20.51.43

dove Schermata 2014-09-21 alle 20.53.02è una funzione di primo ordine. Ma non tratterà Schermata 2014-09-21 alle 20.53.50  come se fosse una funzione del primo ordine di x, e non assumerà questa funzione come un  possibile valore di Schermata 2014-09-21 alle 20.53.02di cui sopra. Si tratta di tali confusioni di tipi che danno origine al paradosso del mentitore.

Inoltre, prendiamo in considerazione le classi che non sono membri di se stesse. E ‘chiaro che, dal momento che abbiamo identificato le classi con le funzioni, * nessuna classe può essere significativamente affermata di essere o di non essere un membro di se stessa; perché i membri di una classe sono argomenti di essa, e gli argomenti di una funzione sono sempre di tipo inferiore rispetto alla funzione. E se ci chiediamo: “Ma che diremmo sulla classe di tutte le classi?

Non è questa una classe, e quindi un membro di se stessa? “, La risposta è duplice. In primo luogo, se” la classe di tutte le classi “significa” la classe di tutte le classi di qualsiasi tipo, ” pertanto non esiste tale nozione. In secondo luogo, se “la classe di tutte le classi” significa “la classe di tutte le classi di tipo t”, allora questa è una classe di tipo successivo rispetto a t, e non è quindi ancora una volta un membro di se stessa.

* Questa identificazione è soggetta ad una modifica da spiegare a breve.

Così, sebbene le proposizioni primitive di cui sopra si applichino indistintamente a tutti i tipi, non ci permettono di suscitare contraddizioni. Pertanto, nel corso di ogni deduzione non è mai necessario considerare il tipo assoluto di una variabile; è solo necessario vedere che le diverse variabili che si verificano in una proposizione sono dei corretti tipi relativi. Ciò esclude tali funzioni come quella da cui è stata ottenuta la nostra quarta contraddizione, e cioè: “Il rapporto R resta valido tra R e S.” Perché una relazione tra R e S è necessariamente di tipo superiore a entrambe esse, così che la funzione proposta è senza significato.

VII. 

Teoria elementare delle Classi e delle Relazioni. 

Le proposizioni in cui si presenta una funzione φ possono dipendere, per il loro valore di verità, dalla particolare funzione φ, oppure possono dipendere solo dalla estensione di φ, ovvero, dagli argomenti che soddisfano φ. Una funzione di quest’ultimo tipo si chiamerà estensionale. Così, ad esempio, “Credo che tutti gli uomini sono mortali” non può essere equivalente a “Io credo che tutti i bipedi implumi sono mortali”, anche se gli uomini hanno lo stesso ambito estensionale con i bipedi implumi; perché non posso sapere che hanno lo stesso ambito estensionale. Ma “tutti gli uomini sono mortali” deve essere equivalente a “tutti i bipedi implumi sono mortali” se gli uomini hanno lo stesso ambito estensionale con bipedi implumi. Così “tutti gli uomini sono mortali” è una funzione estensionale della funzione “x è un uomo”, mentre “Credo che tutti gli uomini sono mortali”, è una funzione che non è estensionale; noi le chiameremo funzioni intensionali quando non sono estensionali. Le funzioni di funzioni delle quali la matematica si occupa sono tutte estensionali.

La scrittura di una funzione f estensionale di una funzione è Schermata 2014-09-22 alle 19.13.35 è

Schermata 2014-09-22 alle 19.14.34

Da qualsiasi funzione f di una funzione Schermata 2014-09-22 alle 19.13.35 possiamo ricavare una funzione estensionale associata come segue. Posto

Schermata 2014-09-22 alle 19.16.20

La funzione Schermata 2014-09-22 alle 20.34.48

è in realtà una funzione di  Schermata 2014-09-22 alle 20.36.35 quantunque non la stessa funzione Schermata 2014-09-22 alle 20.38.31 supponendo che quest’ultima abbia significato. Ma è utile per  trattare tecnicamente  Schermata 2014-09-22 alle 20.34.48come se avesse un argomento Schermata 2014-09-22 alle 20.39.46che noi chiamiamo “la classe definita da ψ.” Abbiamo

Schermata 2014-09-22 alle 20.50.04

da cui , applicando agli oggetti fittizi Schermata 2014-09-22 alle 20.52.23e  Schermata 2014-09-22 alle 20.53.10la definizione di identità di cui sopra, troviamo

Schermata 2014-09-22 alle 20.55.13

Questa, con la sua opposta (che può anche essere dimostrata), è la proprietà distintiva delle classi. Quindi siamo giustificati nel trattare Schermata 2014-09-22 alle 20.52.23

come la classe definita da φ. Allo stesso modo poniamo

Schermata 2014-09-22 alle 20.57.10

Poche parole sono necessarie qui per la distinzione tra Schermata 2014-09-22 alle 20.57.57Schermata 2014-09-22 alle 20.58.06

Noi adotteremo la seguente convenzione: Quando una funzione (al contrario dei suoi valori) è rappresentata in una forma che coinvolge  Schermata 2013-08-22 alle 18.42.59 e  y circonflesso , o qualsiasi altre due lettere dell’alfabeto, il valore di questa funzione per gli argomenti a e b deve  essere trovato sostituendo a ad Schermata 2013-08-22 alle 18.42.59 e b a y circonflesso; ovvero, l’argomento accennato per primo è da sostituire con la lettera che viene prima nell’alfabeto, e l’argomento citato per secondo con la lettera successiva. Questo distingue sufficientemente tra Schermata 2014-09-22 alle 21.06.29 ad esempio:

Schermata 2014-09-22 alle 21.08.56

Poniamo Schermata 2014-09-22 alle 21.09.49

da cui

Schermata 2014-09-22 alle 21.10.36

Inoltre, per l’assioma di riducibilità, abbiamo

Schermata 2014-09-22 alle 21.11.34

da cui

Schermata 2014-09-22 alle 21.12.27

Questo vale qualunque sia x. Supponiamo ora che vogliamo considerare

Schermata 2014-09-22 alle 21.13.21

Abbiamo, da quanto sopra,

Schermata 2014-09-22 alle 21.14.09

da cui

Schermata 2014-09-22 alle 21.14.59

dove x è scritto per ogni espressione della forma

Schermata 2014-09-22 alle 21.15.39

Abbiamo posto

Schermata 2014-09-22 alle 21.16.35

Qui cls ha un significato che dipende dal tipo di variabile apparente φ.

Così, ad esempio, la proposizione “cls ε cls”, che è una conseguenza della definizione di cui sopra, richiede che “cls” abbia un significato diverso nei due luoghi in cui si verifica. Il simbolo “cls” può essere utilizzato solo dove non è necessario conoscere il tipo; esso ha un’ambiguità che si adatta alle circostanze. Se si introduce come un indefinibile la funzione “Indiv! x”, che significa “x è un particolare,” possiamo porre

Schermata 2014-09-22 alle 21.17.36

Allora Kl è un simbolo non ambiguo che significa “classi di particolari.”

Useremo le lettere greche minuscole (tranne ε, φ, ψ, Χ, θ) per rappresentare le classi di qualsiasi tipo; ovvero, per rappresentare i simboli della forma Schermata 2014-09-22 alle 21.18.30

La teoria delle classi va avanti, da questo punto in poi, quasi come nel sistema di Peano;

Schermata 2014-09-22 alle 20.52.23sostituisce Schermata 2014-09-22 alle 21.20.43

Inoltre ho posto

Schermata 2014-09-22 alle 21.21.28

dove Λ, come con Peano, è la classe nulla. I simboli ∃, Λ, V, come cls e ε, sono ambigue, e acquistano un significato preciso solo quando il tipo in questione è altrimenti indicato.

Trattiamo le relazioni esattamente nello stesso modo, ponendo

Schermata 2014-09-22 alle 21.22.25

(essendo l’ordine determinato dall’ordine alfabetico di x e y e l’ordine tipografico di a e b); da cui

Schermata 2014-09-22 alle 21.23.15

donde, per l’assioma di riducibilità,

Schermata 2014-09-22 alle 21.23.47

Usiamo lettere maiuscole latine come abbreviazioni per certi simboli come Schermata 2014-09-22 alle 21.24.41

e troviamo

Schermata 2014-09-22 alle 21.25.31

Poniamo

Schermata 2014-09-22 alle 21.27.02

e troviamo che ogni cosa dimostrata per le classi ha il suo analogo per le relazioni duali.

Seguendo Peano, abbiamo posto

Schermata 2014-09-22 alle 21.27.46

che definisce il prodotto, o la parte comune, di due classi;

Schermata 2014-09-22 alle 21.28.22

che definisce la somma di due classi; e

Schermata 2014-09-22 alle 21.29.01

che definisce la negazione di una classe. Allo stesso modo per le relazioni abbiamo posto

Schermata 2014-09-22 alle 21.29.48

VIII. 

Le Funzioni Descrittive. 

Le funzioni finora considerate sono funzioni proposizionali, con l’eccezione di alcune particolari funzioni quali Schermata 2014-09-23 alle 15.35.04

Ma le funzioni ordinarie della matematica, come la x2, sin x, log x, non sono proposizionali.

Funzioni di questo tipo significano sempre “il termine che ha tale-e-talaltra relazione con x.” Per questo motivo esse possono essere chiamate funzioni descrittive, perché descrivono un certo termine attraverso la sua relazione con il loro argomento. Così “sin π / 2” descrive il numero 1; anche proposizioni in cui il sin π / 2 si verifica non sono le stesse se venissero sostituite dall’1. Questo appare, ad esempio, dalla proposizione “sin π / 2 = 1, “che trasmette informazioni importanti, mentre” 1 = 1 “è banale. Le funzioni descrittive non hanno alcun significato di per sé, ma solo come componenti di proposizioni; e questo vale in generale per le frasi del tipo” il termine che ha la tale e talaltra proprietà.” Quindi nel trattare con tali frasi, dobbiamo definire ogni proposizione in cui si manifestano, non le frasi stesse. *

Siamo così condotti alla seguente definizione, in cui Schermata 2014-09-23 alle 15.37.08

deve essere letto”il termine x che soddisfa φx.”

Schermata 2014-09-23 alle 15.38.16

* Vedere il citato articolo ‘On Denoting “, dove le ragioni di questo punto di vista sono dati particolareggiatamente.

Questa definizione afferma che “il termine che soddisfa φ soddisfa ψ” deve significare: “C’è un termine b tale che φx è vero se e solo se x è b, e ψb è vero” Così tutte le proposizioni su “il così e così” sarà falso se non ci sono dei così-e-così o più così-e-così.

La definizione generale di una funzione descrittiva è

Schermata 2014-09-23 alle 15.39.22

cioè, “R’y” sta a significare “il termine che ha la relazione R con y.” Se ci sono diversi termini o nessun termine aventi la relazione R con y, tutte le proposizioni circa R’y saranno false. Abbiamo posto

Schermata 2014-09-23 alle 15.40.18

Qui Schermata 2014-09-23 alle 15.41.17può essere letto “c’è un termine come la x che soddisfa φx,” o “la x che soddisfa φx esiste.” Abbiamo

Schermata 2014-09-23 alle 15.42.07

La virgola invertita in R’y può essere letta come di. Quindi se R è il rapporto di padre in figlio, “R’y” è “il padre di y.” Se R è il rapporto del figlio con il padre, ‘tutte le proposizioni circa R’y saranno false a meno y ha un figlio e non di più di un figlio.

Da quanto sopra risulta che funzioni descrittivi sono ottenute da relazioni. Le relazioni ora da essere definite sono soprattutto importanti a causa delle funzioni descrittive a cui danno origine.

Schermata 2014-09-23 alle 15.43.18

Qui Cnv è l’abbreviazione di “opposto”. Essa è la relazione di una relazione con la sua opposta; ad esempio, di maggiore con minore, di parentela con l’essere figlio, di precedere con seguire, ecc

Abbiamo

Schermata 2014-09-23 alle 15.44.05

Per una notazione più breve, spesso più utile, abbiamo posto

Schermata 2014-09-23 alle 15.44.44

Vogliamo poi una notazione per la classe di termini che hanno la relazione R con y.

A questo scopo, abbiamo posto

Schermata 2014-09-23 alle 15.45.20

da dove

Schermata 2014-09-23 alle 15.45.54

Allo stesso modo abbiamo posto

Schermata 2014-09-23 alle 15.46.24

da dove

Schermata 2014-09-23 alle 15.46.56

Vogliamo successivamente il dominio di R (cioè, la classe di termini che hanno la relazione R con qualcosa), il dominio inverso di R (cioè, la classe dei termini con cui qualcosa ha la relazione R), e il campo di R, che è la somma del dominio e il dominio inverso. A tal fine definiamo le relazioni di dominio, dominio inverso, e il campo, con R. Le definizioni sono:

Schermata 2014-09-23 alle 15.47.37

Si noti che la terza di queste definizioni è significativa solo quando R è quello che potremmo chiamare una relazione omogenea; ovvero, in cui, se xRy sussiste, x ed y sono dello stesso tipo. Perché nel caso contrario, comunque scegliamo x e y, sia xRy o yRx saranno prive di significato. Questa osservazione è importante in relazione alla contraddizione di Burali-Forti.

Abbiamo, in virtù delle definizioni di cui sopra,

Schermata 2014-09-23 alle 15.48.22

l’ultima delle quali è significativa solo quando R è omogenea. “D’R” si legge “il dominio di R;”Schermata 2014-09-23 alle 15.49.22 si legge “il dominio inverso di R” e “C’R” si legge “il campo di R.” La lettera C è scelta come iniziale della parola “campus”.

Vogliamo successivamente una notazione per la relazione, per una classe α contenuta nel dominio di R, della classe di termini con cui qualche membro α ha la relazione R, e anche per la relazione, con una classe β contenuta nel dominio inverso di R, della classe di termini che hanno la relazione R con qualche membro di β. Per il secondo di questi abbiamo posto

Schermata 2014-09-23 alle 15.50.09

Così che

Schermata 2014-09-23 alle 15.50.55

Quindi se R è la relazione tra padre e figlio, e β è la classe degli Etoniani, Rε‘β sarà la classe “padri degli Etoniani”; se R è la relazione “minore di”, e β è la classe delle frazioni proprie nella forma 1 – 2-n per valori interi di n, Rε‘β sarà la classe di frazioni minori di alcune frazioni della forma 1 – 2-n; ovvero., Rε‘β sarà la classe delle frazioni proprie. L’altra relazione di cui sopra è Schermata 2014-09-23 alle 15.51.51

Abbiamo posto, come notazione alternativa spesso più conveniente,

Schermata 2014-09-23 alle 15.52.30

Il prodotto relativo di due relazioni R, S è la relazione che si verifica fra x e z ogni volta che esiste un termine y tale che xRy e yRz entrambi si verificano.

Il prodotto relativo è indicato con R | S. Così

Schermata 2014-09-23 alle 15.53.24

Abbiamo posto anche

Schermata 2014-09-23 alle 15.54.10

Il prodotto e la somma di una classe di classi sono spesso necessari. Sono definiti come segue:

Schermata 2014-09-23 alle 15.54.47

Analogamente per le relazioni poniamo

Schermata 2014-09-23 alle 15.57.44

Abbiamo bisogno di una notazione per la classe il cui unico membro è x. Peano usa ιx, quindi useremo ι’x. Peano ha mostrato (quello che anche Frege aveva sottolineato) che questa classe non può essere identificata con x. Con il punto di vista abituale sulle classi, la necessità di una tale distinzione rimane un mistero; ma dal punto di vista di cui sopra, diventa evidente.

Abbiamo posto

Schermata 2014-09-23 alle 15.58.37

da dove

Schermata 2014-09-23 alle 15.59.17

e

Schermata 2014-09-23 alle 15.59.55

ovvero, se α è una classe che ha un solo membro, allora Schermata 2014-09-23 alle 16.00.40

è questo unico membro. *

Per la classe di classi contenute in una data classe, abbiamo posto

Schermata 2014-09-23 alle 16.01.41

Possiamo ora procedere alla considerazione dei numeri cardinali e ordinali, e di come essi sono influenzati dalla dottrina di tipi.

* Così   Schermata 2014-09-23 alle 16.04.25 è quello che Peano chiama Schermata 2014-09-23 alle 16.02.32

IX. 

Numeri cardinali.

Il numero cardinale di una classe α è definito come la classe di tutte le classi simili ad α, due classi essendo simile quando vi è una relazione biunivoca tra loro.

La classe delle relazioni biunivoche è indicata con | → | e definito come segue:

Schermata 2014-09-23 alle 16.58.20

Similmente è indicato con Sim; la sua definizione è

Schermata 2014-09-23 alle 16.59.02

Allora Schermata 2014-09-23 alle 16.59.45 è, per definizione, il numero cardinale di α; indicheremo questo con Schermata 2014-09-23 alle 17.00.43quindi poniamo

Schermata 2014-09-23 alle 17.01.19

da cui

Schermata 2014-09-23 alle 17.02.01

Indicheremo la classe dei cardinali con NC; così

Schermata 2014-09-23 alle 17.02.41

0 è definito come la classe il cui unico membro è la classe nulla, Λ, in modo che

Schermata 2014-09-23 alle 17.03.34

La definizione di 1 è

Schermata 2014-09-23 alle 17.04.09

E ‘facile dimostrare che 0 e 1 sono cardinali in accordo con la definizione.

Va osservato, tuttavia, che 0 e 1 e tutti gli altri cardinali, secondo le definizioni di cui sopra, sono simboli ambigui, come cls, e hanno tanti significati quanti sono i tipi. Per cominciare con 0: il significato di 0 dipende da quello di Λ, e il significato di Λ è differente a seconda del tipo di cui è la classe nulla. Così ci sono tanti 0 quanti sono i tipi; e lo stesso vale per tutti gli altri cardinali. Tuttavia, se due classi α, β sono di diversi tipi, si può parlare di esse come aventi lo stesso cardinale, o di una come avente un cardinale maggiore rispetto all’atra, perché una relazione biunivoca può sussistere tra i membri di α e i membri di β, anche quando α e β sono di diversi tipi. Ad esempio, supponiamo β essere ι “α; ovvero., la classe i cui membri sono le classi che consistono dei singoli membri di α. Allora ι “α è di tipo superiore α, ma simile a α, essendo correlata con α dalla relazione biunivoca ι.

La gerarchia dei tipi ha importanti risultati in materia di addizione.

Supponiamo di avere una classe di α termini e una classe di β termini, dove α e β sono cardinali; può essere abbastanza impossibile sommarli tra loro per ottenere una classe di termini α e β, poiché, se le classi non sono dello stesso tipo, la loro somma logica è senza senso. Se solo sono interessate un numero finito di classi, possiamo evitare le conseguenze pratiche di questo, per il fatto che si possono sempre applicare operazioni di una classe che aumenta il suo tipo alla misura richiesta senza alterarne il numero cardinale. Ad esempio, data una qualsiasi classe α, la classe ι”α ha lo stesso numero cardinale, ma è di tipo immediatamente superiore  ad α. Quindi, dato un qualsiasi numero finito di classi di tipi diversi, siamo in grado di aumentarle tutte al tipo che è quello che potremmo chiamare il minimo comune multiplo di tutti i tipi in questione; e si può dimostrare che questo può essere fatto in modo tale che le classi risultanti non abbiano nessun membro in comune. Possiamo poi formare la somma logica di tutte le classi così ottenute, e il suo numero cardinale sarà la somma aritmetica dei numeri cardinali delle classi originali. Ma dove abbiamo una serie infinita di classi di tipi ascendente, questo metodo non può essere applicato. Per questo motivo, non possiamo ora dimostrare che esistano classi infinite. Supponiamo che ci fossero del tutto solo n particolari nell’universo, dove n è finito. Ci sarebbero allora 2n classi di particolari, e 22n  classi di classi di particolari, e così via. Così il numero cardinale dei termini in ogni tipo sarebbe finito e sebbene questi numeri crescano oltre ogni numero finito assegnato, non ci sarebbe modo di sommarli in modo da ottenere un numero infinito. Quindi abbiamo bisogno di un assioma, così mi sembrerebbe, nel senso che nessuna classe finita di particolari contiene tutti i particolari; ma se uno sceglie di assumere che il numero totale di particolari nell’universo è (diciamo) 10.367, non ci sembra un modo a priori di confutare la sua opinione.

Dalla modalità di ragionamento di cui sopra , è chiaro che la dottrina dei tipi evita tutte le difficoltà per il più grande numero cardinale. Esiste un maggiore cardinale in ogni tipo, vale a dire il numero cardinale dell’insieme del tipo; ma questo viene sempre superato dal numero cardinale del tipo successivo, poiché, se α è il numero cardinale di un tipo, quello del tipo successivo è 2α, che, come Cantor ha dimostrato, è sempre maggiore di α. Poiché non c’è modo di sommare tipi differenti, non si può parlare di “il numero cardinale di tutti gli oggetti, di qualsiasi tipo”, e quindi non esiste affatto un più grande numero cardinale.

Se si ammette che nessuna classe finita di particolari contiene tutti i particolari, ne consegue che ci sono classi di particolari aventi qualsiasi numero finito. Quindi esistono tutti i cardinali finiti come singoli-cardinali; cioè, come numeri cardinali di classi di particolari. Ne consegue che esiste una classe di ℵ0 cardinali, vale a dire, la classe dei cardinali finiti. Quindi ℵ0 esiste come il cardinale di una classe di classi di classi di particolari. Formando tutte le classi dei cardinali finiti, troviamo che 2ℵ0 esiste come il cardinale di una classe di classi di classi di classi di particolari; e così possiamo procedere all’infinito. L’esistenza di ℵn per ogni valore finito di n può essere dimostrata; ma questo richiede la considerazione degli ordinali.

Se, oltre ad assumere che nessuna classe finita contiene tutti i particolari, assumiamo l’assioma moltiplicativo (cioè, l’assioma che, dato un insieme di classi mutuamente esclusive, nessuna delle quali è nulla, vi è almeno una classe composta da un membro per ogni classe nell’insieme delle classi), allora possiamo dimostrare che esiste una classe di particolari che contengono ℵ0 membri, in modo che ℵ0 esisterà come singolo-cardinale.

Questo riduce un po’ il tipo verso cui dobbiamo andare al fine di dimostrare il teorema di esistenza per ogni cardinale, ma non ci fornisce alcun teorema di esistenza che non può essere ottenuto in altro modo, prima o poi.

Molti teoremi elementari riguardanti i numeri cardinali richiedono l’assioma moltiplicativo. * E ‘da osservare che questo assioma è equivalente a quello di Zermelo, † e quindi al presupposto che ogni classe può essere ben ordinata. ‡ Queste ipotesi equivalenti sono, a quanto pare, tutte incapaci di prova, anche se l’assioma moltiplicativo, almeno, appare evidente in sé. In assenza di prove, sembra meglio non assumere l’assioma moltiplicativo, ma porlo come un’ipotesi in ogni occasione in cui viene utilizzato.

* Cf. Parte III di un documento dall’autore, “On some Difficulties in the Theory of Transfinite Numbers and Order Types,”, Proc. London Math. Soc. Ser. II, vol. IV, parte I.

† Cf. loc. cit. per una affermazione dell’assioma di Zermelo, e per la prova che questo assioma implica l’assioma moltiplicativo. La deduzione opposta risulta come segue: Poniamo  Prod ‘k per la classe moltiplicativo di k, consideriamo

Schermata 2014-09-23 alle 17.08.08

e assumiamo

Schermata 2014-09-23 alle 17.08.38

Allora R è una correlazione di Zermelo. Quindi se Prod’ Z” cl’α non è nullo, almeno una correlazione di Zermelo con α esiste.

‡ Vedere Zermelo, “Beweis, dass jede Menge wohlgeordnet werden kann.” Math. Annalen, vol. LIX, pp. 514-516.

X. 

Numeri ordinali. 

Un numero ordinale è una classe di una serie ordinalmente simile ben ordinata, cioè, di relazioni che generano tale serie. La similitudine ordinale o somiglianza è definita come segue:

Schermata 2014-09-23 alle 17.10.03

dove “Smor” è l’abbreviazione di “ordinalmente simile.”

La classe di relazioni seriali, che chiameremo “Ser” è definita come segue:

Schermata 2014-09-23 alle 17.13.10

Cioè, leggendo P come “precede”, una relazione è seriale, se (1) nessun termine precede sé stesso, (2) un predecessore di un predecessore è un predecessore, (3) se x è qualsiasi termine nel campo della della relazione, allora i predecessori di x insieme a x insieme con i successori x costituiscono l’intero campo della relazione.

Le relazioni seriali ben ordinate, che chiameremo Ω, sono definite come segue:

Schermata 2014-09-23 alle 17.16.14

ovvero, P genera una serie ben ordinata se P è seriale, e qualsiasi classe α nel campo della P e non nulla ha un primo termine. (Si noti che Schermata 2014-09-23 alle 17.17.01 sono i termini che vengono dopo un certo termine di α).

Se indichiamo con N0’P il numero ordinale di una relazione ben ordinata P, e con NO la classe dei numeri ordinali, avremo

Schermata 2014-09-23 alle 17.18.58

Dalla definizione di N0 abbiamo

Schermata 2014-09-23 alle 17.19.39

Se ora esaminiamo le nostre definizioni dal punto di vista della loro connessione con la teoria dei tipi, vediamo, per cominciare, che le definizioni di “Ser” e Ω coinvolgono i campi delle relazioni seriali. Ora il campo è significativo solo quando la relazione è omogenea; quindi le relazioni che non sono omogenee non generano serie. Ad esempio, la relazione ι potrebbe essere intesa generare serie di numero ordinale ω, come

Schermata 2014-09-23 alle 17.20.15

e potremmo tentare di dimostrare in questo modo l’esistenza di ω e ℵ0. Ma x e ι’x sono di diversi tipi, e quindi non esiste tale serie secondo la definizione.

Il numero ordinale di una serie di particolari è, per la definizione di cui sopra di N0, una classe di relazioni di particolari. È quindi di un tipo diverso da ogni particolare, e non può formare parte di qualsiasi serie in cui si presentano particolari.

Inoltre, supponiamo che  tutti gli ordinali finiti esistano come singoli ordinali; ovvero, come gli ordinali di serie di particolari. Allora gli ordinali finiti stessi formano una serie il cui numero ordinale è ω; quindi ω esiste come ordinale-ordinale, ovvero, come ordinale di una serie di numeri ordinali. Ma il tipo di un ordinale ordinale è quello di classi di relazioni di classi di relazioni di particolari. Così l’esistenza di ω è stata dimostrata in un tipo superiore a quello dei ordinali finiti. Inoltre, il numero cardinale dei numeri ordinali della serie ben ordinata che può essere costituita di ordinali finiti è ℵ1; quindi ℵ1, esiste nel tipo di classi di classi di classi di relazioni di classi di relazioni di particolari. Anche i numeri ordinali della serie ordinata composta da ordinali finiti possono essere disposti in ordine di grandezza, e il risultato è una serie ben ordinata il cui numero ordinale è ω1.

Quindi ω1 esiste come un ordinale ordinale ordinale. Questo processo può essere ripetuto un qualsiasi numero finito di volte, e quindi siamo in grado di dimostrare l’esistenza, in tipi appropriati, di ℵn e ωn per ogni valore finito di n.

Ma il suddetto processo di generazione non porta più a qualsiasi insieme di tutti gli ordinali, perché, se prendiamo tutti gli ordinali di qualsiasi dato tipo, ci sono sempre  ordinali nei tipi superiori; e non siamo in grado di sommare un insieme di ordinali il cui il tipo si alza sopra di ogni limite finito. Così tutti gli ordinali in qualsiasi tipo possono essere organizzati per ordine di grandezza in una serie ben ordinata, che ha un numero ordinale di tipo superiore a quello degli ordinali che compongono la serie.

Nel nuovo tipo, questo nuovo ordinale non è il maggiore. In realtà, non c’è più l’ordinale maggiore in qualunque tipo, ma in ogni tipo tutti gli ordinali sono minori di alcuni ordinali di tipo superiore. E’ impossibile completare la serie dei numeri ordinali, in quanto sale a tipi al di sopra di ogni limite finito assegnabile; così anche se ciascun segmento della serie di ordinali è ben ordinato, non possiamo dire che l’intera serie è ben ordinata, perché “l’intera serie” è una fandonia. Quindi la contraddizione Burali-Forti scompare.

Dalle ultime due sezioni sembra che, se è consentito che il numero di particolari non sia finito, l’esistenza di tutti i numeri cardinali e ordinali di Cantor può essere dimostrata, all’infuori di ℵω e ωω. (E del tutto possibile che l’esistenza di questi possa anche essere dimostrabile.) L’esistenza di tutti i cardinali e ordinali finiti può essere provata senza assumere l’esistenza di qualsiasi cosa.

Perché se il numero cardinale di termini in qualsiasi tipo è n, quello dei termini del tipo successivo è 2n. Quindi se non ci sono particolari, ci sarà una classe (cioè, la classe nulla), due classi di classi (vale a dire, che non contengono nessuna classe e che contiene la classe nulla), quattro classi di classi di classi, e in generale 2n-1 classi di ordine n-esimo. Ma non possiamo sommare insieme termini di tipi diversi, e quindi non possiamo in questo modo dimostrare l’esistenza di qualsiasi classe infinita.

Possiamo ora riassumere tutta la nostra discussione. Dopo aver ricordato alcuni dei paradossi della logica, abbiamo trovato che tutti questi nascono dal fatto che un’espressione che si riferisce a tutti di un qualche insieme può sembrare che essa stessa indichi un elemento dell’insieme; come, per esempio, “tutte le proposizioni sono o vere o false” sembra essere di per sé una proposizione. Abbiamo deciso che, dove questo sembra accadere, stiamo trattando di una falsa totalità, e che in realtà nulla di tutto ciò può essere detto in modo sensato sul tutto del presunto insieme. Al fine di dare attuazione alla presente decisione, abbiamo spiegato una dottrina dei tipi delle variabili, partendo dal principio che ogni espressione che si riferisce a tutto di un certo tipo deve, se denota qualcosa, denotare qualcosa di un tipo superiore di quello a cui il tutto cui si riferisce.

Dove un tutto di qualche tipo viene trattato, vi è una variabile apparente appartenente a tale tipo. Pertanto qualsiasi espressione contenente una variabile apparente è di tipo superiore a questa variabile. Questo è il principio fondamentale della dottrina dei tipi.

Un cambiamento nel modo in cui i tipi sono costruiti, qualora fosse necessario, lascerebbe la soluzione delle contraddizioni intatta fino a che questo principio fondamentale sia rispettato. Il metodo di costruire i tipi spiegato sopra è stato mostrato per premetterci di porre tutte le definizioni fondamentali della matematica, e allo stesso tempo di evitare ogni contraddizione conosciuta. Ed è emerso che, in pratica, la dottrina dei tipi non è mai rilevante se non sono interessati i teoremi di esistenza, o dove le applicazioni devono essere fatte per qualche caso particolare.

La teoria dei tipi solleva una serie di difficili questioni filosofiche riguardanti la sua interpretazione. Queste domande sono, tuttavia, in sostanza separabili dallo sviluppo della teoria matematica, e, come tutte le questioni filosofiche, introducono elementi di incertezza che non appartengono alla teoria stessa. E’ sembrato meglio, dunque, affermare la teoria senza riferimento a questioni filosofiche, lasciando che si affrontino queste in modo indipendente.