verticale

Trasferimento di prodotto tra apparecchiature diverse mediante tecniche statistiche multivariate

In questa tesi viene esposto il problema di trasferimento di prodotto tra diverse apparecchiature che viene applicato ad un processo di produzione di nanoparticelle. Una prima fase, riguarda l'analisi e la comprensione del processo tramite tecniche statistiche multivariate (PCA, PLS, JY-PLS), una seconda fase riguarda in specifico il trasferimento di prodotto tra due diverse apparecchiature, tramite l'applicazione di tecniche di inversione di modello per determinare diverse condizioni operative da utilizzare per produrre nanoparticelle di qualit predefinita. I risultati delle prove di trasferimento effettuate, sono stati convalidati sperimentalmente, ottenendo buoni risultati che confermano la validit di queste tecniche. La procedura esposta ha il vantaggio di affrontare il problema in esame basandosi solo sui dati storici del processo.

Scarica il PDF Scarica il PDF
Aggiungi ai preferiti Aggiungi ai preferiti


Articoli tecnico scientifici o articoli contenenti case history
Tesi di Laurea, Università degli Studi di Padova, Anno Accademico 2011- 2012

Pubblicato
da Alessia De Giosa
VerticaleSegui aziendaSegui




Settori: 

Parole chiave: 


Estratto del testo
UNIVERSIT' DEGLI STUDI DI PADOVA DIPARTIMENTO DI INGEGNERIA INDUSTRIALE






TESI DI LAUREA MAGISTRALE IN INGEGNERIA CHIMICA E DEI PROCESSI INDUSTRIALI


TRASFERIMENTO DI PRODOTTO TRA APPARECCHIATURE DIVERSE MEDIANTE TECNICHE STATISTICHE MULTIVARIATE: APPLICAZIONE A UN PROCESSO DI PRODUZIONE DI NANOPARTICELLE






Relatore: Prof. Massimiliano Barolo

Correlatore: Ing. Emanuele Tomba




Laureanda: NATASCIA MENEGHETTI



ANNO ACCADEMICO 2011'' 2012 Riassunto In questa Tesi è proposta una procedura per il trasferimento di prodotto tra diverse apparecchiature, cioè per la stima delle condizioni operative di un nuovo impianto che assicurino di ottenere un prodotto di qualità desiderata, già ottenuto in un impianto di
riferimento. La procedura proposta si basa sull''utilizzo di tecniche statistiche multivariate per analizzare i dati storici disponibili dai diversi impianti considerati, e fornisce un intervallo di
condizioni operative per l''impianto di interesse da verificare sperimentalmente per ricercare quelle ottimali. La procedura è applicata per supportare il trasferimento di un prodotto ottenuto da un processo di produzione di nanoparticelle di matrice polimerica mediante precipitazione con solvente, impiegando diverse tipologie di miscelatori di piccola scala (~10 -3 m). L''analisi si articola in due fasi principali. In una prima fase si sviluppano dei modelli al fine di comprendere le relazioni che intercorrono tra le condizioni di processo e le variabili che rappresentano le caratteristiche del prodotto. Nella seconda fase, sono applicate metodologie di inversione di modello per determinare le migliori condizioni sperimentali alle quali esercire
il processo nell''apparecchiatura di interesse, al fine di ottenere particelle di dimensione
stabilita. I risultati dell''inversione si dimostrano molto promettenti. La verifica sperimentale della procedura proposta, infatti, mostra ottimi risultati preliminari, dimostrando le potenzialità della metodologia proposta per guidare sperimentazione. Ciò permette di accelerare il trasferimento di prodotto tra impianti di diversa scala o configurazione, e
conseguentemente l''immissione sul mercato del prodotto stesso. Indice INTRODUZIONE .................................................................................................................... 9 CAPITOLO 1 - Il trasferimento di prodotto e il processo di produzione di nanoparticelle ......................................................................................................................... 11 1.1. IL PROBLEMA DEL TRASFERIMENTO DI PRODOTTO ............................................... 11 1.2. PRODUZIONE DI NANOPARTICELLE MEDIANTE L''IMPIEGO DI MIXER
STATICI ................................................................................................................................ 13 1.2.1. Procedura e studi effettuati ............................................................................................ 16 CAPITOLO 2 - Tecniche di analisi statistica multivariata ................................................ 21 2.1. METODI DI ANALISI CORRELATIVA DEI DATI........................................................... 21 2.1.1. Analisi delle componenti principali ............................................................................... 21 2.1.1.1. Analisi dei risultati ................................................................................................ 25 2.1.2. Proiezione su strutture latenti ........................................................................................ 28 2.1.2.1. L''algoritmo NIPALS ............................................................................................. 29 2.1.2.2. Analisi dei risultati ................................................................................................ 30 2.2. METODI PER TRASFERIRE IL PROCESSO TRA PI' APPARECCHIATURE ............. 31 2.2.1. Joint-Y partial least squares regression ......................................................................... 31 2.2.1.1. Il modello JY-PLS ................................................................................................. 32 2.2.2. Metodi di inversione di modello .................................................................................... 35 2.2.2.1. Scenario 1: inversione diretta ................................................................................ 37 2.2.2.2. Scenario 2: inversione con vincoli su xnew ............................................................. 38 2.2.2.3. Scenario 3: inversione con vincoli su xnew e vincoli di disuguaglianza su ynew ..... 39 2.2.2.4. Calcolo dello spazio nullo ..................................................................................... 40 2.2.2.5. Stima dell''incertezza ............................................................................................. 41 CAPITOLO 3 - Comprensione del processo produttivo dall''analisi dei dati ................... 43 3.1. ANALISI PRELIMINARE: STUDIO DEL SET DI DATI PER IL COPOLIMERO
POLI(MEPEGCA-CO-HDCA) ............................................................................................. 43 3.1.1. Struttura dei dati e variabili considerate ........................................................................ 43 3.1.2. Modelli PCA e relazioni tra le variabili......................................................................... 45 3.1.2.1. Modello PCA su tutto il set di dati ........................................................................ 45 3.1.2.2. Modelli PCA per alcune apparecchiature .............................................................. 49 3.1.3. Modelli PLS e relazioni tra le variabili di processo e la dimensione delle particelle .... 53
3.1.3.1. Modello PLS su tutto il set di dati ......................................................................... 53 3.1.3.2. Modelli PLS per alcune apparecchiature ............................................................... 57 3.2. ANALISI PRELIMINARE DEI DATI: STUDIO DEL SET DI DATI PER
L''OMOPOLIMERO POLI-ε-CAPROLATTONE (PCL) ..................................................... 60 3.2.1. Struttura dei dati e variabili considerate ........................................................................ 60 3.2.2. Modelli PCA e relazioni tra le variabili......................................................................... 61 3.2.2.1. Modello PCA su tutto il set di dati ........................................................................ 62 3.2.2.2. Modelli PCA per alcune apparecchiature .............................................................. 63 3.2.3. Modelli PLS e relazioni tra le variabili di processo e la dimensione delle particelle .... 65 3.2.3.1. Modello PLS su tutto il set di dati ......................................................................... 65 3.2.3.2. Modelli PLS per alcune apparecchiature ............................................................... 66 3.3. IMPIEGO DI NUOVE VARIABILI PER IL MIGLIORAMENTO DEI MODELLI ........... 67 3.3.1. Variabili relative al tipo di configurazione .................................................................... 68 3.3.2. Gruppi adimensionali ................................................................................................... 69 3.3.2.1. Polimero PCL ........................................................................................................ 70 3.3.2.2. Copolimero PEG ................................................................................................... 72 3.3.3. Interazioni a due o tre variabili ...................................................................................... 73 3.4. INDIVIDUAZIONE DELLE PROBLEMATICHE LEGATE AL
RAFFREDDAMENTO .......................................................................................................... 75 3.5. CONCLUSIONI .................................................................................................................... 78 CAPITOLO 4 - Analisi congiunta di dati di più apparecchiature .................................... 81 4.1. IMPIEGO DEL METODO JY-PLS PER CORRELARE PI' APPARECCHIATURE ...... 81 4.1.1. Modello JY-PLS sull''intero set di dati .......................................................................... 82 4.1.2. Modelli JY-PLS per il copolimero PCL ........................................................................ 89 4.1.2.1. Modello generale ................................................................................................... 89 4.1.2.2. Modello per le apparecchiature CIJM-d1 e CIJM-d2 ............................................ 93 4.1.2.3. Inserimento di interazioni tra le variabili del modello........................................... 96 4.1.3. Conclusioni .................................................................................................................... 97 CAPITOLO 5 - Trasferimento di prodotto tra apparecchiature diverse ......................... 99 5.1. TRASFERIMENTO DI PRODOTTO: INVERSIONE DEL MODELLO JY-PLS .............. 99 5.1.1. Effetto del numero di variabili latenti ......................................................................... 100 5.1.2. Effetto del numero di campioni considerati ................................................................ 104 5.1.2.1. Estrazione di campioni in modo random ............................................................. 104 5.1.2.2. Estrazione di campioni con procedura d-ottimale ............................................... 105
5.2. TRASFERIMENTO DI PRODOTTO DALL''APPARECCHIATURA CIJM-D1 A
CIJM-D2 .............................................................................................................................. 106 5.2.1. Trasferimento per ottenere particelle di diametro desiderato ...................................... 107 5.2.1.1. Caso 1: scenario 2 in assenza del vincolo sul tipo di polimero ........................... 107 5.2.1.2. Caso 2: scenario 2 con vincolo sul tipo di polimero ............................................ 109 5.2.1.3. Caso 3: scenario 3 in assenza di vincoli sul tipo di polimero .............................. 111 5.2.2. Importanza dello spazio nullo ..................................................................................... 113 5.2.2.1. Spazio nullo monodimensionale: approccio 1 ..................................................... 113 5.2.2.2. Spazio nullo mono e bidimensionale: approccio 2 .............................................. 117 5.2.2.3. Risultati della convalida sperimentale ................................................................. 120 5.2.3. Trasferimento per ottenere particelle al di sotto di un certo diametro ......................... 123 5.2.3.1. Risultati della convalida sperimentale ................................................................. 126 5.2.4. Conclusioni .................................................................................................................. 127 CONCLUSIONI ................................................................................................................... 129 NOMENCLATURA ............................................................................................................. 133 APPENDICE - Codici di calcolo ......................................................................................... 139 RIFERIMENTI BIBLIOGRAFICI .................................................................................... 143 RINGRAZIAMENTI ........................................................................................................... 145 Introduzione Uno dei problemi ricorrenti a livello industriale nello sviluppo di nuovi prodotti e dei relativi sistemi produttivi, riguarda la necessità di trasferire la produzione tra impianti produttivi diversi, siano essi differenti per scala (scale-up), configurazione, o semplicemente
allocazione. L''obiettivo principale del problema di trasferimento di prodotto è in generale quello di assicurare che il prodotto ottenuto nel nuovo impianto sia conforme ai requisiti di qualità richiesti. Questo spesso richiede che in ciascun passaggio di scala, o tra diverse apparecchiature (cioè in ciascun trasferimento), siano organizzate campagne sperimentali per rideterminare le condizioni operative ottimali che assicurino di ottenere un prodotto dalle caratteristiche desiderate e conformi agli standard commerciali. Per questo motivo, il trasferimento di prodotto tra diverse apparecchiature, può risultare un problema particolarmente critico, dal momento che la sperimentazione può rivelarsi dispendiosa per gli elevati tempi di realizzazione, soprattutto nei casi di scale-up, o a volte consentita solo dopo approvazione da parte di organismi di controllo (come nel caso farmaceutico). I metodi comunemente utilizzati in un problema di trasferimento per la stima delle condizioni operative in un nuovo impianto, richiedono spesso la combinazione di competenze specifiche in diversi ambiti (chimico, fisico, fluidodinamico, impiantistico, etc.) e sono spesso basati
sull''utilizzo di regole empiriche, date dall''esperienza maturata rispetto allo specifico processo. In molti casi, si cerca di guidare la sperimentazione sulla base di principi di
similitudine tra l''operazione nei diversi impianti, che portano all''individuazione e l''utilizzo di gruppi adimensionali per assicurare la similitudine tra le operazioni. Tuttavia, la combinazione di diversi criteri per la stima delle condizioni operative più opportune porta a soluzioni spesso in contrasto tra loro, che garantiscono il mantenimento di certe condizioni a scapito di altre. Oltre a ciò, è possibile che i diversi sistemi presentino caratteristiche e vincoli processistici diversi, che devono esser rispettati nella stima delle condizioni operative da utilizzare. Tutto questo si traduce spesso nella necessità di verificare diverse condizioni sperimentali, allungando i tempi della sperimentazione con notevole dispendio di tempo e risorse, e ritardando, nel caso dello sviluppo di un nuovo prodotto, la sua immissione sul mercato. Questo problema è sentito specialmente in settori innovativi, in cui la mancanza di esperienza riguardo ai nuovi processi implica maggiori difficoltà nel trovare una metodologia applicabile e riproducibile per la stima delle condizioni di processo da implementare, creando grosse difficoltà nella pianificazione delle tempistiche necessarie in questa fase.
L''obiettivo di questa Tesi è pertanto quello di presentare una procedura efficiente per il trasferimento di prodotto tra impianti di diversa scala e/o diversa configurazione, che sfrutti al
meglio i dati storici disponibili dalle prove effettuate sui diversi impianti per indirizzare la
sperimentazione all''ottenimento del prodotto desiderato sull''impianto di interesse. La procedura si basa sull''utilizzo di tecniche statistiche multivariate (principal component analysis PCA, partial least square regression PLS, e JY- PLS) che permettono la costruzione di modelli empirici in grado di rappresentare le relazioni tra le variabili di processo e le proprietà del prodotto nei diversi impianti. In particolare, stabiliti i requisiti di qualità del prodotto desiderato, è proposta una procedura di inversione del modello per la determinazione delle nuove condizioni operative da verificare nell''impianto di interesse. Il problema è affrontato considerando un processo per la produzione di nanoparticelle di
matrice polimerica, ottenute mediante precipitazione con solvente con l''utilizzo di diversi tipi di micromiscelatori. Nel caso esaminato, si desiderano ottenere, in una certa apparecchiatura,
nanoparticelle che presentino determinate dimensioni, in modo da assicurare l''efficienza nel loro utilizzo come carrier nel rilascio del principio attivo in applicazioni farmaceutiche. La Tesi è suddivisa in cinque Capitoli. Nel primo Capitolo viene esposto il problema di trasferimento di prodotto e viene descritto dettagliatamente il processo di produzione di nanoparticelle in esame. Nel secondo Capitolo vengono presentate le tecniche di analisi statistica multivariata utilizzate, mentre nel terzo Capitolo vengono presentati i modelli e i
risultati ottenuti dall''applicazione di queste tecniche per la comprensione delle relazioni che intercorrono tra le variabili operative del processo e la dimensione delle nanoparticelle, per i
diversi miscelatori. Nel quarto Capitolo vengono presentati i risultati dell''applicazione della tecnica JY-PLS, che permette l''analisi congiunta dei dati a disposizione delle diverse apparecchiature, al fine di comprenderne le differenze e confrontarne il comportamento. Infine nel quinto Capitolo viene affrontato il problema del trasferimento di prodotto tra due miscelatori, presentando anche i risultati di test effettuati per convalidare la procedura proposta per risolvere il problema in due diversi casi studio. Una sezione finale, riporta le principali conclusioni del lavoro svolto. Capitolo 1 Il trasferimento di prodotto e il processo di produzione di nanoparticelle In questa Tesi viene affrontato il problema del trasferimento di prodotto tra diverse
apparecchiature, mediante l''utilizzo di tecniche statistiche multivariate. Tale problema, di seguito presentato, è affrontato in relazione ad un processo di produzione di nanoparticelle
mediante l''utilizzo di mixer statici, di cui si espongono le caratteristiche e le problematiche in questo Capitolo. 1.1. Il problema del trasferimento di prodotto Il problema del trasferimento di prodotto riguarda la stima delle condizioni operative di un impianto che permettono di ottenere un prodotto finale con caratteristiche simili a quelle del prodotto ottenuto su un altro impianto di riferimento (Garcìa- Muñoz et al., 2005). Riuscire ad ottenere lo stesso prodotto in due o più diverse apparecchiature è un problema che coinvolge la maggior parte dei settori dell''industria chimica e non solo. La stima delle condizioni di processo per avviare la produzione su un nuovo impianto implica la
combinazione di diverse competenze e si avvale spesso dell''utilizzo di regole date
dall''esperienza e dal buon senso, e in alcuni casi di modelli a principi primi. Soprattutto in ambito farmaceutico, è pratica comune il trasferimento della produzione attraverso diverse scale (scale-up), da impianti di laboratorio a impianti pilota e infine al processo di produzione: è fondamentale, in questi trasferimenti, che la qualità del prodotto rispetti rigorosamente gli standard imposti, perciò la stima delle condizioni operative ottimali richiede spesso molto tempo, con risvolti economici non indifferenti sul prodotto finale. In ogni caso una buona conoscenza del processo è ciò che sta alla base di ogni operazione di trasferimento o più semplicemente anche della scelta della strategia di controllo del processo stesso. Da un punto d vista ingegneristico, questo si traduce nella necessità di avere a disposizione un modello del processo in esame. Il modello del processo si traduce matematicamente in un insieme di relazioni tra le variabili in ingresso al sistema (come le condizioni operative e le proprietà delle materie prime) e le variabili risposta (rappresentate il più delle volte dalle qualità del prodotto). Un modello può essere costruito basandosi sulle
regole fondamentali di conservazione della materia o dell''energia (modelli deterministici o a 12 Capitolo 1 principi primi), su un approccio di tipo empirico, sulla base di dati raccolti dagli esperimenti effettuati sul processo in esame, o sulla combinazione dei due. Il primo approccio è quello preferibile ma presenta talvolta difficoltà nel formulare e gestire modelli che siano in grado di predire adeguatamente il comportamento reale del processo. Questo è invece descritto in modo più accurato se ci si basa sui dati storici del processo stesso (Lu and Gao, 2008). Le tecniche di trasferimento che vengono impiegate in questa Tesi si basano quindi su modelli
costruiti a partire dai dati disponibili dal processo in esame, con l''utilizzo di tecniche statistiche multivariate (PLS e JYPLS descritte nel Capitolo 2). La procedura adottata in questa Tesi per affrontare il problema di trasferimento, si basa
sull''utilizzo di tecniche che prevedono l''inversione di modelli statistici a variabili latenti, introdotte da Jaeckle e MacGregor (1998). Tali tecniche prevedono di partire dalle variabili considerate come uscite del modello costruito sul processo in esame (cioè le variabili che
caratterizzano il prodotto), per ricavarne gli ingressi, cioè l''insieme delle condizioni operative relative alle uscite desiderate. Pertanto, le tecniche di inversione applicate al problema di trasferimento permettono di sfruttare i dati di processo disponibili da produzioni di diverso tipo (in generale di diverse apparecchiature), per stimare un insieme di possibili condizioni
operative con cui ottenere un nuovo prodotto con qualità assegnate. L''unica informazione disponibile è quella contenuta nei dati storici, per cui non solo il modello costruito rispecchierà il comportamento del processo nelle condizioni in cui i dati sono stati ricavati,
ma anche i risultati ottenuti dall''inversione rispetteranno le condizioni e i limiti delle variabili operative utilizzate. Allo scopo di individuare un intervallo di condizioni operative che permettessero di ottenere un prodotto con qualità specifiche, a partire dai dati storici di un processo, Jaeckle e MacGregor (2000) hanno implementato questa tecnica per due diversi processi: un processo di polimerizzazione in emulsione per produrre diverse qualità di un certo copolimero e un processo di polimerizzazione in soluzione per produrre diversi tipi di resine. Gli stessi autori (Jaeckle e MacGregor, 2000) hanno utilizzato un approccio simile basato
sull''inversione di modelli a variabili latenti per ottenere in un impianto B, lo stesso prodotto
ottenuto dell''impianto A, in diverse condizioni di processo. I due impianti oggetto dello studio differivano per dimensione e configurazione, ma in entrambi era stata ottenuta una certa quantità di prodotti con caratteristiche simili, di cui disponeva dei dati storici. In seguito, lo studio sulle tecniche di inversione e sulle tecniche di modellazione dei dati utilizzati per questo tipo di problema è stato ulteriormente approfondito da Garcìa-Muñoz et al. (2005), con l''introduzione di un nuovo metodo di regressione a variabili latenti, detto joint-Y projection to latent structures (JY-PLS), che si è dimostrato particolarmente utile perché permette di considerare in un unico modello i dati provenienti dalle diverse apparecchiature, su cui si desidera operare. Nel lavoro originale (Garcìa-Muñoz et al., 2005) il metodo è stato implementato per lo sviluppo e trasferimento di prodotto in due diversi Il trasferimento di prodotto e il processo di produzione di nanoparticelle 13
processi: nella produzione di LLDPE (linear low-density polythylene) in un reattore a letto fluidizzato, e per lo scale-up di un reattore di tipo batch per la produzione di cellulosa,
mostrando come, in quest''ultimo caso, le condizioni calcolate dal modello si avvicinassero
molto a quelle dell''impianto reale. Garcìa-Muñoz et al. (2006) hanno in seguito applicato
tecniche di inversione di modello a variabili latenti per l''ottimizzazione dell''intera traiettoria delle condizioni operative in un processo batch per l''estrazione della cellulosa, in modo da
assicurare l''ottenimento di un prodotto con specifiche caratteristiche, minimizzando il tempo di ogni ciclo batch. Garcìa-Mũnoz et al. (2009) hanno utilizzato queste tecniche per definire dei limiti di
accettabilità per nuove materie prime, indipendenti dalla scala dell''impianto di produzione,
considerando allo stesso tempo l''effetto combinato delle materie prime, delle condizioni di processo e della presenza di diverse scale sulla qualità del prodotto finale. Tecniche statistiche multivariate per affrontare problemi di scale-up sono state applicate anche da Muteki et al. (2011), in un processo farmaceutico di granulazione ad umido, dimostrando come queste tecniche si presentino come una valida alternativa a quelle che si utilizzano attualmente nei problemi di scale-up di queste apparecchiature (per esempio, si sfrutta la similitudine geometrica delle apparecchiature, e il dimensionamento è basato
sull''analisi adimensionale e su parametri specifici, non sempre semplici da calcolare) e si
riduca la richiesta di principio attivo in fase di sviluppo. Un''ulteriore applicazione è stata presentata da Liu et al.(2011) per lo scale-up di un processo di granulazione a freddo per uso farmaceutico, utilizzando l''inversione di un modello JYPLS costruito sui dati dei due impianti in esame. I risultati hanno dimostrato come i metodi applicati siano stati in grado di stimare in modo soddisfacente le nuove condizioni di scale-up per assicurare tutte le qualità richieste al prodotto.
L''utilizzo di tecniche di inversione di modelli che si basano su dati empirici permette quindi di guidare la sperimentazione, individuando un intervallo ristretto di condizioni di processo che consente di ottenere il prodotto desiderato: i vantaggi nell''impiego di queste tecniche riguardano non solo il guadagno in termini di tempo, ma anche un risparmio considerevole di materia prima ed energia evitando di condurre diverse prove in intervalli molto ampi di condizioni per tentare di trovare quelle ottimali che soddisfino le caratteristiche ricercate nel prodotto. 1.2. Produzione di nanoparticelle mediante l''impiego di mixer statici Questa Tesi si basa sull''analisi di dati riguardanti esperimenti effettuati su un processo di produzione di nanoparticelle in mixer statici dell''ordine dei micrometri. Gli esperimenti sono 14 Capitolo 1 stati condotti dai ricercatori del gruppo del Prof. Barresi e del Prof. Marchisio presso il Dipartimento di Scienza Applicata e Tecnologia del Politecnico di Torino.
Questi esperimenti sono nati dall''esigenza dello sviluppo e dello studio di micro-miscelatori adatti ad applicazioni in ambito farmaceutico. Per micro-miscelatori si intendono sistemi la
cui dimensione caratteristica assume valori nell''intorno di 10-6 m: in queste scale il comportamento del processo è strettamente controllato da fenomeni di tipo molecolare, che
implicano miscelamenti di tipo diffusivo, molto rapidi. In quest''ambito si sono mostrati particolarmente interessanti gli studi su micro-miscelatori a larga scala, ovvero con dimensioni caratteristiche tra 10 -4 e 10-3 m. In questi sistemi è permessa una maggiore instabilità dei flussi, fino a raggiungere, in situazioni estreme, condizioni di mescolamento di tipo turbolento. Queste apparecchiature mantengono gli stessi vantaggi dei micro-miscelatori di tipo passivo; permettono infatti: un buon controllo delle condizioni di processo, un mescolamento omogeneo e rapido, brevi tempi di residenza, con una distribuzione ristretta, e infine benefici di tipo economico come un minor consumo di energia e la possibilità di scale-up più semplici per intensificare il processo (Lince et al., 2010). Sono stati quindi studiati diversi tipi di micro-miscelatori di quest''ultima categoria, nella produzione di nanoparticelle di diversi polimeri per applicazioni di tipo farmaceutico. In
questo ambito infatti, si sta ampliando sempre di più l''interesse per le nanotecnologie, in
quanto si è visto come queste offrano la possibilità di aumentare l''attività terapeutica del principio attivo in fase di rilascio, di ridurre effetti indesiderati e di aumentare la resistenza del principio attivo in vivo (Valente et al., 2012). In particolare, nelle terapie contro le
neoplasie, l''impiego di nanoparticelle è particolarmente utile in quanto, grazie all''effetto
dell''avanzata ritenzione e permeabilità, riescono ad accumularsi nei tessuti porosi tumorali. Una volta raggiunto il tessuto malato, il principio attivo (API), viene rilasciato con un flusso controllato dalla velocità di degradazione del carrier, ovvero della nanoparticella che lo
contiene. Quindi l''effetto finale dipende non solo dalle proprietà fisico-chimiche del principio attivo, ma anche dalle caratteristiche del carrier. Una delle specifiche più importanti a riguardo, oltre le caratteristiche della superficie delle nanoparticelle, è la loro dimensione: infatti per evitare interazioni negative con il sistema reticoloendoteliale, la dimensione delle nanoparticelle deve esser inferiore a 250-200 nm, garantendo in questo modo una permanenza nel flusso sanguigno e un rilascio del principio attivo adeguati. Per queste applicazioni, il maggior interesse è rivolto verso nanoparticelle di polimero biodegradabile, che sia in grado di essere riassorbito dal corpo dopo la disintegrazione. In questo studio, sono state effettuate prove sperimentali utilizzando due tipi di polimero, in particolare il poli-ε-caprolattone (PCL) e il copolimero poli(mettossipolietilenglicolcianoacrilato-co-esadecilcianoacrilato). Il primo è un polimero Il trasferimento di prodotto e il processo di produzione di nanoparticelle 15
standard commerciale molto usato per applicazioni farmaceutiche, il secondo è un copolimero graffato con catene idrofobiche legate a catene idrofile costituite dal polietilenglicole (PEG). In generale si parla di nanoparticelle riferendosi sia a nanosfere (NS) di polimero che nanocapsule (NC). Alla prima categoria appartengono le nanoparticelle in cui principio attivo è incorporato nella matrice della particella stessa. Per nanocapsule invece si intendono le particelle che presentano un nucleo interno liquido, in cui è disciolto il principio attivo, avvolto da uno strato polimerico esterno (Valente et al., 2012). In questo studio vengono utilizzati i dati di particelle di entrambe le categorie: nanosfere prodotte con PCL e poli(MePEGCA-co-HDCA) e nanocapsule prodotte con poli(MePEGCA-co-HDCA) in presenza di olio.
Il modo in cui il principio attivo è incapsulato o intrappolato all''interno della nanoparticella, dipende dal metodo di preparazione utilizzato: emulsione-evaporazione, emulsione-diffusione o precipitazione con solvente. Quest''ultima tecnica offre diversi vantaggi rispetto alle altre,
tra cui la riproducibilità di particelle di dimensioni nell''ordine dei nanometri e la possibilità di utilizzare solventi non tossici, ed è il metodo scelto nella produzione di nanoparticelle con mixer statici. Il processo si svolge in due stadi principali: la formazione della soluzione polimero +
principio attivo in un solvente (in questo studio è stato utilizzato l''acetone o il tetraidrofurano), e la miscelazione della soluzione ottenuta con un non-solvente (nel processo in studio acqua), immiscibile con il polimero ma miscibile con il solvente, che porta alla formazione delle nanoparticelle (Lince et al., 2008). La formazione di nanocapsule e di nanoparticelle durante il processo di precipitazione mediante solvente coinvolge dinamiche complesse, teorizzate e interpretate in numerosi studi. Secondo gli studi effettuati sui meccanismi di precipitazione (Horn e Rieger, 2001; Mersmann, 1999; Jones, 2002), il processo si svolge in tre stadi principali: nucleazione, accrescimento e aggregazione. La velocità di ogni stadio determina la distribuzione finale delle dimensioni delle particelle e altre caratteristiche importanti. Nello stadio di nucleazione, la forza motrice per la formazione dei nuclei è il livello di sovrassaturazione raggiunto mediante il mescolamento solvente-non solvente. ' molto importante ricordare che le condizioni di flusso e di miscelamento locali determinano il livello di sovrassaturazione, e dal momento che il processo è molto rapido, determinano anche la velocità di nucleazione. Quindi, in generale, una scarsa miscelazione provoca basse velocità di nucleazione e di conseguenza la formazione di particelle a diametro maggiore; viceversa, una buona miscelazione favorisce la formazione di particelle a diametro inferiore. In ogni caso, la percentuale di sovrassaturazione è influenzata anche dalla composizione locale della
miscela, che dipende tra l''altro anche dal rapporto solvente/non solvente. Il secondo fenomeno coinvolto è l''accrescimento molecolare, definito come l''attaccamento di molecole 16 Capitolo 1 di polimero nella matrice delle particelle, e che quindi dipende dalla capacità di diffusione
dalla zona di bulk alla superficie delle particelle stesse. L''aggregazione, invece, è un fenomeno di tipo secondario, che dipende dalla frequenza delle collisioni tra le particelle e dalla loro stabilità (Lince et al., 2008). Dal momento che la formazione delle nanoparticelle è quasi istantanea, è necessario che la miscelazione sia altrettanto rapida, perciò è necessario l''utilizzo di apparecchiature che garantiscano tale condizioni, come appunto i miscelatori statici di piccola scala. 1.2.1.Procedura e studi effettuati I miscelatori utilizzati negli esperimenti di cui si hanno a disposizione i dati sono in tutto 9 apparecchiature, di diversa configurazione e scala. Le caratteristiche geometriche sono riassunte in Tabella 1.1. Tabella 1.1. Miscelatori utilizzati nella produzione di nanoparticelle:
configurazione e geometria delle 9 apparecchiature utilizzate Miscelatore a getti collidenti confinati Miscelatore a T Miscelatore a vortice standard e multi-inlet CIJM T SVM-MIVM
2 ingressi 4 ingressi Tipologie utilizzate secondo le caratteristiche geometriche [mm]
d D d D
d D Dist CIJM-d2 2 4.8 T-d1 1 2 w-a-w-a 1 4 2 CIJM-d1 1 4.8 T-d2 2 2 w-w-a-a 1 4 4 CIJM-SU 2 9.6 w-a 1 4 4 CIJM-SD 0.5 2.4 La procedura nella produzione di nanoparticelle prevede di alimentare 2 mL di soluzione polimerica in acetone o tetraidrofurano in uno dei due ingressi dei miscelatori, e 2 mL di
acqua bidistillata nell''altro (in due ingressi nel caso di MIVM, Tabella 1.1), con due pompe a siringa. La temperatura di processo è mantenuta costante a 30°C. Il flusso in uscita è raccolto Il trasferimento di prodotto e il processo di produzione di nanoparticelle 17
e diluito in un volume di 10 mL di acqua. Questa è la fase di quench o raffreddamento, che impedisce processi secondari che potrebbero modificare il prodotto. Infine, vengono prelevati dei campioni per determinare la qualità della produzione. Questa procedura assicura che non accada nulla tra la fase di prelievo dei campioni e quella di misurazione. Le nanoparticelle vengono caratterizzate secondo alcuni parametri: la distribuzione delle dimensioni, il diametro medio delle particelle e il potenziale zeta. Il potenziale zeta è
un''indicazione della carica superficiale delle particelle e della forza repulsiva che si instaura tra queste, che determina la stabilità della sospensione, e quindi la tendenza o meno
all''aggregazione delle nanoparticelle. La distribuzione dei diametri e il diametro medio sono determinati attraverso la tecnica di dynamic light scattering o DLS (Zetasizer Nanoseries ZS),
il cui l''intervallo di misurazione dello strumento si estende da 0.6 nm a 3 μm, mentre il potenziale zeta è misurato dalla stessa apparecchiatura con misure elettroforetiche. Queste misure, ottenute tramite DLS, sono controllate in modo rigoroso per accertare che siano assicurate le specifiche di qualità della misura, come il conteggio del numero di particelle, la polidispersità e il rumore di fondo. Ogni esperimento viene ripetuto tre volte per convalidare la riproducibilità del processo e tutto il protocollo di caratterizzazione. Su queste misure vengono poi calcolati i valori medi che vengono riportati come risultati, assieme alle relative barre di errore per ciascuna misura. Le caratteristiche del processo vengono riassunte in Tabella 1.2. Tabella 1.2. Caratteristiche del processo di produzione di nanoparticelle in
esame. Tipo di processo Produzione di nanoparticelle per precipitazione mediante non solvente, con l'uso di
mixer statici Scopo del processo Ottenere particelle contenenti un principio attivo, di dimensione tra i 20-300 nm da
usare come carrier Polimeri utilizzati ' Omopolimero poli-ε-caprolattone (PCL)
' Copolimero poli(MePEGCA-co-HDCA) Solventi ' Acetone
' Tetraidrofurano (THF) Non solvente ' Acqua Dispositivi impiegati ' Miscelatore a getti collidenti confinati (CIJM)
' Miscelatore a T (T)
' Miscelatore a vortice di tipo standard e multi-inlet (MIVM) Descrizione del processo ' La soluzione del polimero-farmaco-solvente, viene mescolata con il non-solvente che causa la precipitazione di nanoparticelle ' La corrente d''uscita è diluita con acqua distillata; questo quench evita ulteriori fenomeni di aggregazione ' Il solvente viene eliminato mediante evaporazione Tipi di analisi effettuate ' Dynamic light scattering per misurare la media delle dimensioni delle particelle
' Misure elettroforetiche per calcolare il potenziale zeta 18 Capitolo 1 Sono state esaminate diverse condizioni di processo per studiare il comportamento del sistema: diverse portate agli ingressi, diversi rapporti non solvente/solvente, diverse concentrazioni di polimero e diversi solventi; inoltre, sono state eseguite prove con o senza raffreddamento esterno. Sono stati condotti numerosi studi sui prodotti ottenuti, sia per
analizzare l''influenza dei diversi fattori che influenzano il processo, sia per ottimizzarlo. Nel lavoro di Lince et al. (2008) viene studiato il processo di precipitazione per la produzione di nanoparticelle di PCL con miscelatori di configurazione CIJM, concentrandosi sulla termodinamica e cinetica del processo e sugli effetti delle condizioni di processo sul prodotto finale. Lince et al. (2011) rivolgono l''attenzione al copolimero poli(MePEGCA-co-HDCA), di cui si valutano gli effetti delle condizioni di processo sulla dimensione delle particelle e
sulla morfologia di queste. L''effetto di alcuni parametri viene studiato anche con simulazioni CFD (computational fluid dynamics), per quantificare le condizioni di miscelazione
all''interno della camera del CIJM, in modo da utilizzare i risultati per la progettazione o ottimizzazione di processo.
L''efficienza e il confronto tra diversi tipi di mixers nella produzione di nanoparticelle con entrambi i polimeri è stata invece trattata nel lavoro di Lince et al. (2011), in cui si è inoltre
costruito un modello matematico basato sui tempi di mescolamento per l''ottimizzazione e lo scale-up dell''impianto. ' stato inoltre studiato il processo di produzione di nanocapsule caricate di principio attivo per renderlo industrialmente applicabile (Lince et al. 2011), con particolare interesse non solo nella caratterizzazione delle particelle, in base alla dimensione e alle caratteristiche superficiali, ma anche nell''analisi del contenuto di principio attivo e dei relativi effetti sulla produzione in particelle ottenute seguendo un certo protocollo ottimizzato. Questo studio è stato proseguito da Valente et al. (2012), approfondendo la conoscenza sui meccanismi e sui fattori che influenzano maggiormente la produzione di nanoparticelle, considerando anche nuove variabili di processo. Nel lavoro di Valente et al. (2012) infine, è stata data maggior attenzione al confronto tra i meccanismi di formazione di nanosfere e nanocapsule, evidenziando la possibilità di utilizzare gruppi adimensionali per agevolare lo scale-up delle apparecchiature. In base a questi studi si sono riassunte in Tabella 1.3 le relazioni di maggior interesse per
l''analisi in corso, in cui si considerano solo gli effetti sulla dimensione delle particelle, a causa della scarsa affidabilità della misura del potenziale zeta. Il trasferimento di prodotto e il processo di produzione di nanoparticelle 19
Tabella 1.3. Effetti delle variabili di processo sulla dimensione delle
nanoparticelle e relative cause dovute al comportamento del processo. VARIABILE MANIPOLATA INFLUENZA SULLA DIMENSIONE DELLE PARTICELLE FENOMENI CHIMICO-FISICI COINVOLTI Portata Influenza significativa: in generale
particelle a diametro inferiore a portate
elevate, per valori minori di 40-60 mL/min,
la dipendenza è più marcata. Un aumento della portata d''ingresso implica
un aumento dell''energia cinetica turbolenta
all''interno del sistema, e quindi del grado di
miscelazione. Quando le condizioni migliori
di miscelazione sono raggiunte, un ulteriore
aumento non produce miglioramenti
apprezzabili. Configurazione e
geometria
Dimensioni minori, a parità di portata, sono
raggiunte in ordine di configurazione:
CIJM-d2, T-d2, T-d1, CIJM-d1. La presenza della camera di mixing e un
minor diametro d''ingresso, migliorano le
prestazione di mescolamento. Concentrazione e
tipo di polimero
La dipendenza dalla concentrazione di
polimero dipende dal tipo di nanoparticella
prodotta: un aumento della concentrazione
porta a valori maggiori di diametro nel caso
di nanosfere, viceversa si ottengono
particelle a dimensioni minori aumentando
la concentrazione di polimero nel caso di
nanocapsule. Un aumento nella concentrazione iniziale di
polimero favorisce la fase di accrescimento
delle nanosfere rispetto a quella di
nucleazione, inoltre in presenza di una
maggior quantità di polimero anche la fase di
aggregazione è favorita.
Per quanto riguarda le nanocapsule, non è
ancora chiaro il meccanismo, probabilmente
se la quantità di polimero è insufficiente, la
forma della nanoparticella collassa. Rapporto non-
solvente/solvente

Effetto non completamente chiaro e
dipendente dalla concentrazione di
polimero. Sembra che un aumento del
contenuto d''acqua ne determini una
diminuzione ma l''ulteriore aumento ne
determina un leggera crescita. Il rapporto è diminuito diminuendo la portata
di acetone per cui la turbolenza risulta in
generale meno efficiente. Inoltre dato che è
diminuita la portata di solvente, diminuisce la
quantità di polimero introdotto: è per questo
che l''effetto di questa variabile dipende anche
dalla concentrazione iniziale di polimero. Tipo di solvente Particelle di dimensioni minori con l''uso di
acetone. Questo comportamento è dovuto alla
differenza di proprietà dei due solventi
(condizioni di mixing diverse) e interazione
intermolecolare tra acqua/acetone e
acqua/THF(diversa struttura chimica). Raffreddamento Effetto molto marcato: in generale particelle a dimensioni minori in presenza di
raffreddamento. La fase di raffreddamento previene l''ulteriore
agglomerazione delle nanoparticelle al di
fuori del mixer, e ne stabilizza la crescita.
Con l''applicazione delle tecniche di statistica multivariata considerate in questa Tesi, si vogliono ritrovare le relazioni presentate, ricavate da un approccio di tipo ''classico'' e
chiarirne gli andamenti, ma con metodi per certi versi più efficaci, che implichino l''impiego di minor tempo. Inoltre, si vogliono sfruttare le relazioni ricavate da tali tecniche utilizzando i dati di diverse apparecchiature, per supportare il trasferimento di prodotto tra due diversi miscelatori. Capitolo 2 Tecniche di analisi statistica multivariata Si presentano in questo Capitolo le diverse tecniche statistiche multivariate utilizzate per costruire dei modelli rappresentativi del processo di produzione di nanoparticelle, a partire da metodologie di analisi correlativa dei dati utili a descrivere e a comprendere il processo fino a metodi impiegati per ottimizzare il trasferimento di prodotto. 2.1. Metodi di analisi correlativa dei dati Le tecniche che verranno presentate permettono di costruire modelli che rappresentano il
sistema in esame a partire da dati a disposizione, attraverso l''individuazione di nuove variabili in numero minore rispetto a quelle originali, ma che catturano in maniera ottimale la variabilità dei dati. La prima tecnica (PCA) permette di studiare le correlazioni tra le variabili misurate per i dati a disposizione, mentre la seconda tecnica (PLS) permette di costruire modelli di regressione tra le variabili di ingresso al sistema (regressori) e le variabili risposta. 2.1.1. Analisi delle componenti principali L''analisi delle componenti principali (PCA, principal component analysis) è uno dei metodi più utilizzati per trattare dati numerosi, correlati tra loro e rumorosi, in modo da estrarre da questi le informazioni essenziali per la comprensione del comportamento del sistema in studio. Molto spesso le informazioni essenziali non sono descritte dalle variabili di processo in modo indipendente, ma da come queste variano le une rispetto alle altre, ossia dalla loro covarianza. La PCA risponde a questa richiesta, trovando le combinazioni delle variabili analizzate che descrivono le direzioni più significative nella variabilità di un insieme di dati (Wise e Gallagher, 1996). Si assume in generale che i dati del processo in esame siano raccolti in una matrice X [N'M], in cui ogni riga n rappresenta un campione e ogni colonna m una variabile. La PCA da un punto di vista algebrico è la decomposizione della matrice di dati X in M matrici Ma, di rango unitario (Geladi e Kowalski, 1986): ' ' ' M a a 1 M X . (2.1) 22 Capitolo 2 Il valore inferiore che può assumere A nella (2.1) coincide con il rango di X, ossia con il numero di variabili indipendenti tra loro. A sua volta ogni matrice Ma può essere espresse come il prodotto esterno di 2 vettori t e p di dimensione rispettivamente n'1 e m'1: T a a a p t M ' (2.2)
L''equazione definitiva della PCA diventa: ' ' ' ' ' ' M a a a M a a 1 T 1 p t M X (2.3) I vettori a t sono detti scores e contengono le informazioni sulle relazioni tra i campioni della matrice X, mentre i vettori a p , detti loadings, rappresentano le relazioni tra le variabili della stessa. Questi ultimi sono tra loro ortonormali, cioè: ij j i  ' p p T , (2.4) essendo ij  il delta di Kronecker. Gli scores sono invece solo ortogonali: i ij j i   ' t t T , (2.5) dove i  è un autovalore della matrice X X T . La PCA consiste infatti nella decomposizione in autovettori, rappresentati dai loadings, della matrice di covarianza o della matrice di correlazione della matrice X (Wise and Gallagher, 1996), definita come: 1 ) cov( T ' ' n X X X . (2.6) Il fatto di considerare la matrice di covarianza o la matrice di correlazione nell''analisi dipende dal metodo di pretrattamento dei dati in X. Il pretrattamento dei dati avviene tramite le operazioni di bilanciamento al valor medio (mean-centering) e riduzione della scala (autoscaling): il primo consiste nell''aggiustare i valori delle colonne di X sottraendo da ognuna la rispettiva media originale, in modo da
ottenere per ogni colonna media pari a 0; il secondo consiste nell''operare il mean-centering e dividere ogni elemento della colonna per la deviazione standard della stessa. In particolare, se le colonne di una matrice sono state bilanciate rispetto la media, X X T rappresenta la matrice di covarianza di X; nel caso la matrice sia stata ''scalata', X X T rappresenta la matrice di Tecniche di analisi statistica multivariata 23

correlazione. L''analisi con le diverse matrici fornisce risultati diversi. Le applicazioni della
PCA nei successivi Capitoli, prevedono l''applicazione dell''autoscaling alle matrici utilizzate. In questo modo infatti si prescinde dalle unità di misura delle variabili, dando lo stesso peso ad ognuna di esse. La PCA scompone dunque la matrice dei dati X nella somma dei prodotti esterni tra i vettori i t e i p , più una matrice E, detta dei residui: E p t ... p t p t X 2 2 1 1 ' ' ' ' ' T A A T T , (2.7) dove a risulta essere minore o uguale della più piccola dimensione di X. In forma concisa si può scrivere che: T TP X ' , (2.8) essendo T la matrice che ha i vettori i t come colonne e P la matrice che contiene i vettori ' p i come righe. Nella (2.8) la matrice E dei residui è stata omessa. Si nota che per ogni coppia ) , ( i p t i accade che a a t Xp ' . (2.9) I vettori scores sono cioè combinazioni lineari dei dati originari, definite da a p . Le coppie ) , ( a a p t sono disposte in ordine decrescente secondo il valore di a  associato, che rappresenta una misura della varianza dei dati descritta da ciascuna coppia, cioè delle informazioni contenute nel modello. Secondo questa successione, la prima coppia ) , ( a a p t descrive la quantità maggiore di varianza presente nei dati, rappresentata dall''indice R2. Questo indice è calcolato come: TSS RSS R ' '1 2 (2.10) In cui RSS è la somma dei quadrati dei residui (en,m) per ogni elemento di X e TSS rappresenta la varianza totale della matrice X.
I concetti alla base dell''analisi delle componenti principali hanno un preciso significato geometrico, che può essere esemplificato dalle rappresentazioni di Figura 2.1. Si supponga di misurare 3 variabili (vi) per un certo numero di campioni. Ad ogni campione è quindi associato un vettore con 3 componenti, che possono essere viste come proiezioni su uno spazio tridimensionale (Figura 2.1a). Questo spazio assume il nome di spazio delle variabili (variable space o feature space), che può essere in generale di più dimensioni. La PCA 24 Capitolo 2 rappresenta un mezzo per identificare nello spazio delle variabili, le direzioni che meglio descrivono la posizione dei vari campioni. Un esempio è fornito in Figura 2.1b: in essa si nota che la maggior parte dei campioni si dispongono lungo una direzione, che identifica la componente principale (PC1). Questa descrive la maggior parte della variabilità dei dati. La restante varianza è catturata dalla seconda componente principale, che risulta per definizione ortogonale alla prima (PC2). Queste rette non sono parallele a nessuno degli assi che rappresentano le variabili reali: questo è tipico della maggior parte delle applicazioni della PCA. Risulta quindi più conveniente descrivere i punti rappresentati tramite le loro proiezioni sullo spazio delle componenti principali (cioè gli scores), piuttosto che sullo spazio delle variabili reali.
(a) (b)
Figura 2.1. Interpretazione geometrica della PCA: (a) rappresentazioni di un generico set
di dati sullo spazio delle variabili (vi). (b) Direzioni delle componenti principali
individuate che meglio descrivono il comportamento lineare dei dati. La direzione della
prima componente principale è individuata dal vettore p. Gli scores sono invece le
coordinate dei punti sulle rette. In particolare, i loadings calcolati dalla PCA contengono i coseni direttori dello spazio delle
componenti principali. Nell''esempio di Figura 2.1b, avendo identificato due componenti
principali, l''andamento dei dati è descritto da un piano la cui giacitura è determinata dai due vettori loadings (p) individuati (in Figura 2.1b vengono riportati solo quelli per la prima componente principale). I vettori scores, che hanno un numero di righe pari al numero di
punti nell''esempio di Figura 2.1b, rappresentano invece le proiezioni, ovvero le coordinate, di ciascun punto sul piano delle due componente principali (t1 e t2). In base a questo si comprende il ruolo della PCA nella descrizione di dati sperimentali: come si è visto, le componenti principali riassumono le caratteristiche di un certo dato sperimentale, Tecniche di analisi statistica multivariata 25
definito da più variabili ''fisiche'', in un numero inferiore di variabili ''fittizie'', dette latenti, che individuano in maniera chiaramente interpretabile le direzioni di variabilità dei dati. ' importante, in questo senso, scegliere il numero opportuno di componenti principali da considerare affinché il modello rappresenti in modo adeguato la variabilità dei dati su cui è stato costruito. Vi sono diversi metodi che possono esser utilizzati per determinare il numero di componenti principali, per esempio (Wise et al, 2006):
' considerare la varianza spiegata, R2, da ogni componente principale, che deve esser sufficientemente elevata, cioè si stabilisce una certa soglia al di sotto della quale
l''informazione contenuta nelle successive componenti principali può essere trascurata, in quanto considerata variabilità non sistematica; ' in base all''autovalore corrispondente ad ogni componente principale, che deve essere superiore o prossimo all''unità. Dato che la matrice risulta scalata, ogni autovalore può essere interpretato come il numero di variabili di una certa importanza descritta da ciascuna componente principale; ' in base ai valori della radice dell''errore quadratico medio in convalida incrociata (RMSECV, root mean squared error of cross validation), indice dell''errore medio di ricostruzione per ogni componente principale. La convalida incrociata prevede di estrarre un certo numero (fissato a priori) di campioni per volta, e ricostruire un modello sui dati rimanenti. Vengono poi riproiettati i dati estratti sul modello costruito, e viene calcolato
l''RMESECV come (Wise et al., 2006): m n PRESS RMSECV A a a '' ' ' '1 (2.11) In cui n·m è il numero di elementi della matrice utilizzata per il modello, A sono il numero di componenti principali e PRESS (predicted residual error sum of squares) rappresenta la somma dei quadrati delle differenze fra i dati reali e quelli ricostruiti dalla proiezione sullo spazio delle componenti principali. Spesso si predilige la combinazione dei vari metodi nella scelta finale del numero di componenti principali. 2.1.1.1. Analisi dei risultati Una volta costruito il modello, i risultati vengono analizzati mediante l''analisi del diagramma degli scores (matrice T) che si ricordano rappresentare le relazioni tra i campioni, e il diagramma dei loadings (matrice P) che riporta le relazioni tra le variabili considerate. Nello studio di un processo è utile comprendere la relazione tra i due diagrammi sia per utilizzare 26 Capitolo 2 queste informazioni in fase di analisi e di comprensione del processo, sia per fini di monitoraggio e troubleshooting sul processo stesso. Si riportano come esempio due diagrammi costruiti su un ristretto set di dati disponibili in Figura 2.2.
-0.6 -0.4 -0.2 0.0 0.2 0.4 0.6 0.8 -0.8 -0.6 -0.4 -0.2 0.0 0.2 0.4 0.6 0.8 Loa ding s su P C 2 Loadings su PC1 1 2 4 3 5 (a) -4 -2 0 2 4 -4 -3 -2 -1 0 1 2 3 4 S cor es su P C 2 Scores su PC1 (b) Figura 2.2. (a) Esempio di diagramma dei loadings e (b) del diagramma degli scores sulle
le prime due componenti principali di un modello fittizio. Assumendo che siano necessarie solo due componenti principali per il modello PCA
costruito, l''interpretazione dei due piani segue questa logica:
' per quanto riguarda i loadings, ogni punto rappresenta una variabile, ossia una colonna della matrice X. Se due punti, ossia due variabili, si trovano in posizioni vicine e appartengono
allo stesso quadrante, allora in generale si sono direttamente correlate, ovvero all''aumentare
del valore di una aumenta anche il valore dell''altra. Questo è il caso delle variabili 3 e 5 in Figura 2.2a.
Se due variabili si dispongono in opposizione l''una con l''altra rispetto all''origine o a uno degli assi coordinati, presentando segno opposto come le variabili 2 e 4, allora si sono anticorrelate, ossia il comportamento delle due è opposto: all''aumentare di una, l''altra assume valori inferiori.
Per le altre variabili è necessario studiare caso per caso la posizione e l''importanza su ogni componente principale. Per esempio le variabili 3 e 5 sono correlate alla 4 rispetto alla prima componente, ma non rispetto alla seconda. In questi casi è necessario comprendere quale direzione catturi la maggior parte della variazione di ogni variabile per poter stimare la reciproca relazione; ' per quanto riguarda gli scores (Figura 2.2b), la differenza nelle loro posizioni dipende dal valore per ogni campione delle variabili nella matrice X. L''interpretazione del diagramma è possibile quindi dal confronto con il relativo piano dei loadings: i campioni che si trovano sulla destra del piano, giacciono in corrispondenza della variabile 2, per cui presenteranno valori maggiori per questa variabile e minori per la variabile 3; viceversa per i campioni Tecniche di analisi statistica multivariata 27
sulla parte sinistra del piano. Quelli che si posizionano sulla parte superiore, presenteranno valori maggiori della variabile 1 e minori della variabile 5, viceversa per quelli sulla parte inferiore del piano. ' per questo motivo che si osservano in Figura 2.2b dei clusters, ovvero dei raggruppamenti, che individuano campioni ottenuti con valori simili delle variabili. Infine, dal momento che si tratta di tecniche di tipo statistico, è utile introdurre degli indici, utilizzati spesso nelle tecniche di controllo statistico di processo, che indichino quanto il modello si avvicini a descrivere la realtà dei dati. Dagli scores di ogni campione è possibile ricavare la statistica 2 A T di Hotelling, riferita ad un numero A di componenti principali selezionate, calcolata come: ' ' ' A a a a A T 1 2 2 2 s t , (2.12) essendo ta l''elemento relativo al campione considerato del vettore degli scores rispetto all''a- esima componente, mentre 2 a s la varianza stimata di ciascuna colonna della matrice T degli scores dei campioni con cui si è costruito il modello, con l''assunzione che essi siano normalmente distribuiti. In generale, la statistica 2 A T rappresenta la distanza di ogni campione dall''origine dello spazio ridotto definito dalle A componenti principali. Valori anomali di tale statistica indicano che il campione è lontano dalla media attesa, ovvero la ricostruzione di tale
campione rappresenta un''estrapolazione, per cui non è assicurata la validità delle relazioni descritte dal modello, dal momento che si sta esplorando una regione dello spazio delle variabili non nota al modello. In generale, i limiti di fiducia degli indici 2 A T , oltre i quali il campione è da considerarsi anomalo, sono calcolati come (Wise e Gallagher, 1996):   , 1 , 2 , , ) 1 ( ' '' ' ' '' ' n A n A F A n n A T . (2.13) Nella (2.15) n rappresenta il numero di campioni esaminati per sviluppare il modello PCA, mentre  , 1 , ' n A F è il valore della distribuzione F, che dipende da A e n-1 gradi di libertà e dal limite di fiducia applicato (1-α). Quando utilizzato, il limite di fiducia è solitamente calcolato al 95%.
Un''altra statistica importante è rappresentata dall''SPE o errore quadratico in predizione (squared prediction error; Kourti e MacGregor, 1994) che quantifica la capacità del modello di descrivere i dati . Questo viene calcolato in base alla matrice dei residui E ottenuta come: ' P T X E ' ' (2.14) Da ciascuna riga di E (rappresentata dal vettore eA) viene calcolato l''SPE: 28 Capitolo 2 A T A A SPE e e ' . (2.15) La statistica SPE rappresenta, come accennato, la distanza euclidea di ciascun campione dal sottospazio generato dalle prime A componenti principali. Valori di SPE oltre ai limiti di fiducia sono indicativi di campioni che si comportano in modo diverso rispetto a quelli utilizzati per la costruzione del modello, non seguendo la struttura di correlazione dello stesso. I limiti di fiducia per la statistica SPE, denominata anche Q, possono essere calcolati come segue (Wise e Gallagher, 1996): 0 / 1 2 1 0 0 2 1 2 0 2 1 ) 1 ( 1 2 h h h h z Q ' '
' ' ' '
' ' ' ' '' '' ' ' ' ' '' ' '' '' '' ' '   , (2.16) essendo ' ' ' ' ' ) ( 1 ) ( X rango A j k j k  e 2 2 3 1 0 3 2 1 ' '' ' '' ' '' ' ' h . i  è l''i-esimo autovalore della matrice della covarianza dei residui E E T , mentre  z è il 100'(1-α) percentile della distribuzione normale standard. 2.1.2. Proiezione su strutture latenti La proiezione su strutture latenti, nota anche come metodo della regressione parziale ai minimi quadrati (partial least squares, PLS), è un metodo di regressione utilizzato per correlare due matrici di dati tra loro, con scopo in genere predittivo. Esso cerca cioè di trovare la relazione presente tra i dati contenuti in una matrice X e le variabili risposta della matrice Y, attraverso la costruzione di un modello che, noto il valore delle variabili in X (i regressori), ritorni il valore di un certo numero di variabili predette in Y. In generale, il metodo PLS è di fondamentale importanza in chemiometria e nel controllo di statistico di processo soprattutto in quei casi in cui, come nella PCA, si devono trattare molti dati, spesso altamente correlati tra loro, non solo per quanto riguarda le variabili predittrici,
ma anche nel caso delle variabili predette. In questo senso, l''analisi PLS trova i fattori che catturano la parte della varianza nelle variabili in X, maggiormente correlata alle variabili latenti che descrivono la variabilità delle variabili in Y. Le matrici X dei predittori e Y delle variabili predette, dopo essere state autoscalate, sono decomposte come: E p t E TP X ' ' ' ' ' ' A a T a a T 1 (2.17) F q u F UQ Y ' ' ' ' ' ' A a T a a T 1 . (2.18) Tecniche di analisi statistica multivariata 29
Anche la matrice Y può essere multivariata, cioè può essere costruito un unico modello che
correli più variabili predette con un''unica matrice di predittori. I vettori degli scores a t sono calcolati per ogni dimensione a=1,2,..A del modello PLS, in modo che la combinazione lineare delle variabili in X, attraverso degli opportuni pesi (detti weights), data da a a w X t ' , e la combinazione lineare delle variabili in Y, data dalla a a q Y u ' , massimizzino la covarianza tra X e Y, spiegata da ciascuna dimensione a della PLS. I pesi wa e qa sono introdotti per
mantenere l''ortogonalità degli scores. L''analisi correla gli scores della matrice X con gli scores della matrice Y attraverso una relazione interna lineare: a a a t u b ' , (2.19) Essendo ba un elemento del vettore dei coefficienti di regressione della relazione interna a b . 2.1.2.1. L''algoritmo NIPALS Uno dei più comuni metodi utilizzati per calcolare i parametri di un modello PLS è
l''algoritmo noto con il nome NIPALS (non-iterative partial least squares; Geladi e Kowalski, 1986). Esso calcola scores, loadings, pesi e coefficienti di regressione secondo una procedura sequenziale. Si seleziona una colonna di Y come stima iniziale per 1 u (di solito quella con maggiore varianza). Nel caso di y univariata è ovviamente y u ' 1 . Si calcolano i pesi (weights) e gli scores partendo da X: 1 ' 1 ' 1 u X u X w ' (2.20) 1 1 Xw t ' . (2.21) Si determinano scores e loadings per Y: 1 ' 1 1 ' 1 1 t u t u q ' (2.22) 1 1 Yq u ' (2.23) Si controlla la convergenza, confrontando 1 t dalla (2.21) con quello ottenuto all''iterazione precedente. Se la differenza è inferiore alla tolleranza applicata si passa alla (2.24), altrimenti si ritorna alla (2.20), utilizzando 1 u calcolato dalla (2.23). Nel caso y sia univariato la (2.22) e la (2.23) possono essere omesse, ponendo 1 q =1. Si calcolano i loadings per X e si scalano scores e pesi: 30 Capitolo 2 1 ' 1 1 ' 1 t t t X p ' (2.24) old old new , 1 , 1 , 1 p p p ' (2.25) old old new , 1 , 1 , 1 p t t ' (2.26) old old new , 1 , 1 , 1 p w w ' (2.27) Si trovano i coefficienti di regressione b per la relazione interna: 1 ' 1 1 ' 1 1 t t t u b ' (2.28) Dopo che gli scores e i loadings sono stati calcolati per la prima componente principale, è possibile calcolare i residui per X e per Y come segue: ' 1 1 1 p t X E ' ' (2.29) ' 1 1 1 1 q u b Y F ' ' (2.30)
L''intera procedura viene quindi ripetuta per la successiva componente principale, fino
all''ultima considerata, partendo dalla (2.18) e sostituendo X e Y con i loro residui E 1 e F1. Gli scores e i loadings calcolati con la PLS sono diversi da quelli calcolati con la PCA. Si può tuttavia pensare che essi siano calcolati come nella PCA e successivamente ruotati per meglio rappresentare e predire Y. Nel caso tutte le componenti principali trovate siano incluse nel modello, si annullano le matrici dei residui e l''analisi diventa una regressione lineare multivariata (Wise e Gallagher, 1996). Per il calcolo delle variabili latenti da considerare per la costruzione del modello, ci si basa sugli stessi metodi presentati per la PCA, ma in questo caso la varianza spiegata e il RMSECV per variabile latente devono esser calcolati anche per Y, sostituendo gli elementi di tale matrice nel calcolo della (2.10) e della (2.11). 2.1.2.2. Analisi dei risultati
L''analisi delle relazioni tra le variabili predittrici e le variabili predette, è analoga a quella presentata per il modello PCA: è necessario riportare nello stesso piano la posizione dei pesi wi delle variabili in X con i loadings qi delle variabili risposta Y e confrontare simultaneamente la posizione di questi con la posizione degli scores dei campioni. Anche per i modelli PLS valgono inoltre le statistiche viste per i modelli PCA, ma vengono utilizzati Tecniche di analisi statistica multivariata 31
degli ulteriori indici per valutare le prestazioni del modello nella stima della variabile
predetta. L''errore commesso nella stima di tale variabile in fase di calibrazione, ovvero in
fase di costruzione del modello, è rappresentato dall''errore quadratico medio in calibrazione (RMSEC, Root Mean Square Error of Calibration) come: ' ' n y y RMSEC n i i i ' ' ' ' 1 2 ' (2.31) In cui n è il numero di campioni e i i y y ' ' è la differenza fra la i-esima riga di Y e la corrispondente ricostruzione mediante i parametri del modello PLS ( i y' ). Per analizzare il comportamento del modello in fase di predizione, ovvero rispetto a dati che non appartengono
alla matrice con cui è costruito il modello, si utilizza l''errore quadratico medio in predizione (RMSEP, root mean square error of prediction), calcolato come in (2.31), dove i y è il valore vero della variabile da predire per l''i-esimo campione del set esterno (cioè non usato per costruire il modello), mentre i y' è il corrispondente valore predetto dal modello. Infine, per calcolare l''importanza di ciascuna variabile nella predizione delle variabili
risposta, si utilizza l''indice VIP (variable importance in projectio; Chong e Jun, 2005). Questo indice viene calcolato per ciascuna variabile di qualità e indica quali variabili di processo hanno peso maggiore nella predizione alla j-esima variabile risposta: ' ' ' ' ' ' ' ' ' ' ' A a a a a A a a j,a a a a j b b m VIP 1 2 1 2 2 t t w w t t ' ' (2.32) in cui m è il numero di variabili della matrice X, ed A è il numero di variabili latenti. 2.2. Metodi per trasferire il processo tra più apparecchiature Uno degli scopi di questa Tesi è di verificare alcune procedure per rendere più semplice e veloce la procedura di trasferimento di prodotto tra due apparecchiature. Pertanto si sono sfruttati dei metodi che si sono già dimostrati particolarmente adatti a tal fine in diverse applicazioni: il metodo JY-PLS e l''inversione di modello. 2.2.1. Joint-Y partial least squares regression La proiezione su strutture latenti detta joint-Y partial least square regression (JY-PLS), è un metodo di regressione basato sull''utilizzo di variabili latenti creato per modellare dati di più impianti o apparecchiature, che possono esser considerati in un unico modello (Garcìa-Muñoz 32 Capitolo 2 et al., 2005). Questo metodo è utile in problemi di scale-up o di trasferimento di prodotto tra diverse apparecchiature che producono prodotti simili ma con valori diversi di alcune qualità caratterizzanti, per mantenere indipendenti le informazioni portate dal set di dati di ciascun sito.
Si assume di avere a disposizione i dati per due diversi impianti, l''impianto A e B, raccolti rispettivamente nelle matrici Xa e Xb a cui sono associate le matrici della variabili risposta Ya e Yb. In generale i due siti possono differire sia nel numero che nel tipo di variabili che descrivono le condizioni di processo, raccolte nelle colonne delle matrici X, come possono differire anche per il numero di campioni esaminati (che ne costituiscono le righe). Infatti i due impianti possono presentare diversa struttura o dimensione, essere stati costruiti in luoghi o tempi diversi ed operare in condizioni ambientali differenti, ma in generale si assume che il processo dipenda in entrambi dagli stessi fenomeni chimico-fisici. Infatti il modello proposto
si basa sull''assunzione che i prodotti dei due impianti A e B, non siano necessariamente identici, ma che debbano condividere una stessa struttura di correlazione, in modo che gli scores di ciascun sito ottenuti dal modello giacciano in uno spazio comune definito dalle variabili latenti, in cui vi è la possibilità di trasferire le informazioni tra le matrici Xa e Xb. Il vantaggio fondamentale del modello JY-PLS è quindi la possibilità di utilizzare una matrice comune YJ per stimare questo spazio comune tra le due matrici su cui si basa il trasferimento (Garcìa-Muñoz et al., 2005). 2.2.1.1. Il modello JY-PLS Il modello JY-PLS sviluppato deriva da un''estensione del più semplice metodo di regressione PLS. Si costruisce pertanto un modello PLS per ciascuno dei due siti A e B, che viene riportato graficamente in Figura 2.3a. (a) (b) Figura 2.3. Rappresentazione grafica (a) del modello PLS e (b) del modello JY-PLS. La simbologia è la stessa utilizzata per definire i parametri di un generale modello PLS, indicizzati secondo il sito di appartenenza (a o b). Se si assume che i dati contenuti nelle Tecniche di analisi statistica multivariata 33
matrici Ya e Yb appartengano ad un piano comune formato da un certo numero di variabili latenti, i loadings Qa e Qb si riducono ad essere solo una rotazione gli uni rispetto agli altri, e possono essere congiunti in un'unica matrice QJ, che descrive il piano latente formato dalla matrice composta da Ya e Yb, ovvero YJ (Figura 2.3b). La JY-PLS è quindi una tecnica di regressione che permette di modellare il piano della matrice YJ, unione delle matrici risposta
dei siti in considerazione. L''unica restrizione è che nelle matrici Y, le variabili che definiscono la qualità devono essere le stesse, cioè le due matrici devono presentare lo stesso numero e tipo di colonne, e una correlazione comune tra di esse. La correlazione tra le variabili risposta dei siti in esame, può essere verificata nel caso di Y multivariato, costruendo un modello PCA con le variabili risposta Ya di un impianto e proiettandovi la matrice Yb dell'altro: l''SPE per Yb deve risultare dentro i limiti calcolati e il rango delle due matrici deve risultare lo stesso (Garcìa-Muñoz et al., 2005). Come anticipato, questo metodo di regressione deriva dal metodo di proiezione su strutture latenti, per cui i pesi (Wa e Wb ) e i loadings (Pa e Pb) delle due matrici hanno lo stesso significato visto per il modello PLS, ma sono ricavati rispetto al piano individuato dalla matrice comune YJ e definito dalla relativa matrice comune dei loadings QJ. I pesi Wa e Wb definiscono quindi le direzioni di variazione nei dati di Xa e Xb maggiormente correlate con le direzioni latenti dello spazio comune di YJ, rappresentate da QJ. I parametri in questione formano la struttura del modello JY-PLS come espresso nelle (2.33-2.37): YJ T J b a J E Q Tb Ta Y Y Y ' ' ' ' ' ' ' ' ' ' ' ' ' ' ' (2.33) Xa T a a a E P T X ' ' (2.34) Xb T b b b E P T X ' ' (2.35) * a a a W X T ' (2.36) * b b b W X T ' (2.37) In cui EXa e EXb rappresentano gli errori di ricostruzione, ovvero le matrici dei residui. La relazione di regressione tra X e Y prende in questo caso la forma (Liu et al., 2012): ' ' B X Q W X Q T Y a ' J * a a ' J a a ' ' ' ' (2.38) ' ' B X Q W X Q T Y b ' J * b b ' J b b ' ' ' ' (2.39) in cui la matrice dei coefficienti B è data da: ' J * b Q W B ' (2.40) 34 Capitolo 2 I parametri utilizzati nella costruzione del modello, vengono stimati sulla base dei dati dei due impianti, attraverso la massimizzazione di una funzione obiettivo la cui soluzione restituisce le matrici dei loadings. Questa funzione obiettivo può essere ricavata secondo Garcìa- Muñoz et al. (2005) dalla modifica della funzione obiettivo utilizzata per il metodo PLS, ma la soluzione, sotto certe condizioni, equivale a quella ottenuta con l''applicazione dell''algoritmo NIPALS modificato per il problema in esame. La procedura, di tipo sequenziale, viene riportata di seguito. Innanzitutto vengono inizializzati i vettori ua e ub il cui valore è posto pari alle prime colonne delle matrici Ya e Yb rispettivamente. Vengono poi calcolati i weights wa e wb come: ' ' 1 a T
a a T
a a ' ' u u u X w e ' ' 1 b T
b b T
b b ' ' u u u X w (2.41) Vengono poi normalizzati i vettori risultanti: 1 a ' b w w (2.42) Si calcolano quindi gli scores dai parametri appena ottenuti: ' ' 1 a T
a a a ' ' w w w X t a e ' ' 1 T ' ' b b b b w w w X t b (2.43) Da questi si calcola il vettore dei loadings di YJ: ' '1 T ' ' J J J J t t t Y q T J (2.44) Si ricalcolano i valori di ua e ub : ' ' 1 J T
J J a ' ' q q q Y u a e ' ' 1 J T
J J b ' ' q q q Y u b (2.45) Questi valori vengono confrontati con quelli iniziali e nel caso in cui non vi sia coincidenza si
riparte dall''equazione (2.41) sulla base dei valori ottenuti in (2.45) e si procede in modo iterativo, fino a convergenza, cioè fino a quando la differenza tra ua e ub di iterazioni successive, sarà minore della tolleranza imposta. Una volta raggiunta la convergenza, si calcolano i loadings di X come: ' ' 1 a T
a a T
a a ' ' t t t X p e ' ' 1 b T
b b T
b b ' ' t t t X p (2.46) Tecniche di analisi statistica multivariata 35
Per calcolare i parametri per la variabile latente successiva, è necessario considerare come nuove matrici X e Y i residui delle precedenti: T p t - X X a a a a ' e T p t - X X b b b b ' (2.47) T q t - Y Y J a a a ' e T q t - Y Y J b b b ' (2.48) Si segue la stessa procedura per tutte le variabili latenti scelte. Infine, dopo aver calcolato i parametri per ogni variabile latente, si calcolano i pesi finali delle due matrici: ' ' 1 a T a a * a ' ' W P W W e ' ' 1 b T b b * b ' ' W P W W (2.49)
La condizione per cui l''algoritmo iterativo NIPALS esposto e la soluzione ottenuta dalla massimizzazione di una funzione obiettivo se si segue un approccio agli autovalori- autovettori (analogo a quello per il modello PLS) coincidono, è data dal metodo di pretrattamento delle matrici, infatti devono essere scalate secondo: a a m n m n m n ' ' , a , a X X e b b m n b m n b m n ' ' , , X X (2.50) In cui na indica il numero di righe della matrice Xa e nb il numero di righe della matrice Xb. analogamente per le matrici delle variabili risposta: a k n k n n , a , a Y Y ' e b k n b k n b n , , Y Y ' (2.51) Questo tipo di pretrattamento rende la varianza totale delle matrici identica e assicura che la normalizzazione dei vettori wa e wb sia ragionevole, dato che i due vettori dovrebbero avere la stessa lunghezza sotto queste condizioni, anche se le righe delle due matrici sono diverse. Nel caso sia necessario considerare più di due siti all''interno del modello, la procedura rimane la stessa, ma estesa a tutte le matrici considerate. Anche per questo modello vengono utilizzate le stesse statistiche presentate per il modello PCA e PLS. 2.2.2. Metodi di inversione di modello I metodi basati sull''inversione di modelli statistici, in specifico di modelli a variabili latenti, sono stati sviluppati con lo scopo di stimare le condizioni operative più adatte ad ottenere un 36 Capitolo 2 prodotto con specifiche caratteristiche desiderate. Sono metodi utilizzati per rendere più efficienti sia la procedura di trasferimento del prodotto, come nel caso in esame, sia
l''ottimizzazione di prodotto. Figura 2.4. Rappresentazione grafica del problema di trasferimento di prodotto: si
ricercano le condizioni di processo xnew nell''impianto B che restituiscano un prodotto ydes
ottenuto nell''impianto A. Da un punto di vista modellistico, si tratta di stimare le condizioni migliori in ingresso, rappresentate dal vettore xnew [1'M] in cui M è il numero di variabili della matrice X, che corrispondono ad una qualità desiderata del prodotto, rappresentata dal vettore delle variabili risposta ydes [1'K].
Si assume che, nel caso di trasferimento di prodotto tra l''impianto A e B, le caratteristiche del
prodotto che si desiderano raggiungere con l''impianto B, sono già state ottenute in A, o che il set delle variabili risposta desiderate ydes rispetti la struttura di correlazione individuata dalle proprietà dei prodotti storici. Graficamente questo procedimento è riportato in Figura 2.4.
L''utilizzo di metodi di regressione basati su strutture latenti è stato introdotto da Jaeckle e
MacGregor (2000), che hanno dimostrato come l''inversione di un modello basato sui dati storici di un processo, possa essere utilizzata per stimare un intervallo di condizioni in cui il processo dovrebbe operare per garantire un prodotto con le caratteristiche desiderate. Nel loro lavoro è stato inoltre dimostrato come la soluzione così ottenuta non sia in generale unica, ma dipenda dalla differenza tra il rango della matrice X e quello della matrice Y: se il rango della matrice X è maggiore di quello della matrice Y, il problema presenta infinite soluzioni.
L''insieme delle soluzioni che derivano dalla realizzazione dell''inversione in questa situazione formano un sottospazio chiamato spazio nullo. Per selezionare la soluzione migliore fra quelle che costituiscono lo spazio nullo, è necessario risolvere un problema di ottimizzazione, in cui possono esser considerati diversi tipi di vincoli, a seconda del tipo di problema. Sono state introdotte nel tempo varie modifiche al metodo proposto da Jeackle e MacGregor,
che hanno portato allo sviluppo di diverse metodologie per l''inversione in base alle necessità dei problemi in esame. Le diverse formulazioni sviluppate, sono state raccolte e riorganizzate nel lavoro di Tomba et al. (2012), su cui si basano le informazioni di seguito riportate. Tecniche di analisi statistica multivariata 37
In generale la procedura di inversione può essere sintetizzata secondo uno schema sequenziale: 1.costruzione del modello a variabili latenti (PLS, MB-PLS, JY-PLS) tra le matrice delle condizioni di processo (X) e delle variabili risposta (Y); 2.determinazione delle qualità del prodotto desiderato ydes secondo valori fissati (vincoli di uguaglianza) o in termini di intervalli di accettabilità (vincoli di disuguaglianza); 3.determinazione degli eventuali vincoli di tipo fisico o secondo le necessità processistiche per il vettore soluzione xnew, in termini di vincoli di uguaglianza o disuguaglianza; 4.verifica delle condizioni imposte su ydes, affinché il prodotto desiderato appartenga allo stesso spazio dei campioni su cui si costruisce il modello, ovvero presenti un SPEydes almeno inferiore al limite di confidenza del 95%; 5. inversione del modello costruito secondo il problema di minimizzazione più adeguato; 6.analisi dei risultati in termini di differenza tra ydes e ŷnew ovvero le qualità corrispondenti alle condizioni stimate, T 2 di Hotelling e SPEx new, ossia errore quadratico in predizione per la soluzione stimata. Affinché questa procedura fornisca dei risultati accettabili, è necessario partire da un modello che descriva in modo adeguato il processo e assicurarsi, come evidenziato al punto 4, che le qualità richieste per il prodotto desiderato siano in linea con quelle su cui si è costruito il modello, ovvero appartengano alla stessa struttura latente. Come anticipato ai punti 2 e 3, in un problema di inversione di modello, è necessario imporre dei vincoli affinché la soluzione calcolata rispetti i requisiti fisici delle variabili di processo o
affinché rimanga all''interno di un certo intervallo di condizioni previste dal sistema. Lo stesso per quanto riguarda il vettore variabile risposta ydes che include le specifiche di progetto per il prodotto. Inoltre è preferibile che la soluzione trovata xnew appartenga allo spazio in cui giacciono le condizioni di processo dei dati a disposizione. Per assicurare tale condizione, si inseriscono dei vincoli di tipo statistico, su T 2 di Hotelling e su SPEx new, che possono esser imposti come vincoli di tipo soft (cioè includendoli direttamente nella funzione obiettivo) o come hard (ossia come vincoli al problema di ottimizzazione). Secondo la trattazione di Tomba et al. (2012), in base ai vincoli che si vogliono considerare nel problema di inversione, si possono individuare diversi problemi di minimizzazione, in cui si utilizzano specifiche funzioni obiettivo da minimizzare per ottenere una soluzione che rispetti le caratteristiche desiderate. Ne vengono esaminati tre, ovvero solo quelli utilizzati nello studio effettuato, identificati come diversi scenari. 2.2.2.1. Scenario 1: inversione diretta Nel caso in cui non venga considerato nessun tipo di vincolo per il vettore soluzione xnew e che le qualità del prodotto rappresentate in ydes siano completamente determinate, può essere 38 Capitolo 2
applicata l''inversione diretta del modello costruito sui dati del processo in esame. Questo metodo prevede di calcolare il vettore degli scores tdes che corrisponde in base ai parametri del modello, al vettore ydes secondo la relazione: ' ' T des T 1 T T des y Q Q Q t ' ' (2.52) Una volta calcolati gli scores si ricavano le variabili che costituiscono il vettore xnew come: T des new ' P t x ' (2.53) In questo modo la soluzione trovata appartiene allo spazio del modello, ovvero rispetta la struttura di covarianza dei dati storici. 2.2.2.2. Scenario 2: inversione con vincoli su xnew Quando vi è la necessità di specificare dei vincoli per il vettore soluzione xnew e nel caso in cui il vettore ydes sia completamente definito, la funzione obiettivo impiegata è: new new x 1 de new des new ) ( ) ( min SPE g T s '' ' ' ' ' t t t t t (2.54) In cui: ' ' T des T 1 T T des y Q Q Q t ' ' (2.55) T new new ' Q t y ' (2.56) T new new ' P t x ' (2.57) * new new ' W x t ' (2.58) 95 %lim T SPE g SPE x, x x x x '' ' ' ' ' 2 new new new new x ) ' )( ' ( new (2.59) e i i , new c ' x (2.60) i i , new d ' x (2.61) x x x i i , new i ub lb ' ' e y y y i i , des i ub lb ' ' (2.62) In (2.54) Σ è una matrice diagonale che determina il peso di ogni componente di tnew, calcolato mediante la minimizzazione della funzione obiettivo. ' buona norma utilizzare come pesi in Σ la varianza di ciascuna colonna nella matrice T degli scores del modello. In generale può risultare difficile trovare una soluzione al problema che rispetti i vincoli imposti e giaccia sullo spazio individuato dal modello utilizzato. Per questo motivo è consigliabile, affinché la soluzione rispetti la struttura dei dati storici, inserire il vincolo di tipo soft su SPExnew. Tecniche di analisi statistica multivariata 39
In aggiunta viene specificato anche un vincolo di tipo hard, ancora sull'' SPExnew, esterno alla funzione obiettivo in (2.59). In questo modo, anche se la soluzione non apparterrà allo spazio del modello, la sua distanza da questo spazio si manterrà al di sotto della soglia limite al 95%,
calcolata in base ai dati storici. In questo caso risulta necessario l''utilizzo di entrambi i vincoli, sia di tipo hard che soft su SPExnew, perché il primo assicura che la soluzione non presenti un valore di tale indice inaccettabile, rischio che si può correre se ci si limita alla sola imposizione del vincolo soft, mentre quest''ultimo impedisce di ottenere una soluzione con un valore di SPE ancorato al valore imposto dal vincolo hard. I parametri g1 e g2 pesano l''importanza che viene data nella procedura di minimizzazione ai vincoli rispettivamente di tipo soft e hard su SPExnew. Una buona scelta per g1 è rappresentata dal reciproco del limite al 95% di questo indice ( 95 %lim SPE x, ), calcolato sui dati storici del processo, mentre è consigliabile imporre g2 <1 (per esempio 0.9), in modo da diminuire il valore del vincolo hard. Infine vengono specificati i vincoli su xnew e ydes di tipo fisico (2.62), come intervallo tra un valore superiore (lb) e uno inferiore (ub) che rappresentano il dominio della soluzione o della variabile risposta, e i vincoli su xnew in base alle condizioni di processo desiderate, come vincolo di uguaglianza (2.60) o disuguaglianza (2.61) rispetto ad un certo valore per ogni componente i-esima del vettore soluzione. 2.2.2.3. Scenario 3: inversione con vincoli su xnew e vincoli di disuguaglianza su ynew Nel caso in cui non tutte le caratteristiche di ydes siano fissate o nel caso siano specificate delle regioni di accettabilità per le proprietà desiderate del prodotto (vincoli di disuguaglianza sugli elementi di ydes ), la formulazione del problema di minimizzazione è diversa rispetto al caso precedente e si presenta come: n ew n ew x 1 2 2 1 3 des new des new x ) ' ( ) ' ( min SPE g g a a A a T '' ' '' ' ' '' ' ' ' '' ' ' ' ' s t y y G y y (2.63) In cui: T new new ' Q t y ' (2.64) T new new ' P t x ' (2.65) * new new W x t ' (2.66) 95 %lim T SPE g SPE x, x x x x '' ' ' ' ' 2 new new new new x ) ' )( ' ( new (2.67) e i i , new c ' x (2.68) i i , new d ' x (2.69) x x x i i , new i ub lb ' ' e y y y i i , des i ub lb ' ' (2.70) E in aggiunta: 40 Capitolo 2 i b ' i new, 'y (2.71) In cui si nota che viene imposto un ulteriore vincolo soft sul T 2 di Hotelling. Tale vincolo nella funzione obiettivo, viene pesato con g3, che solitamente viene posto pari al reciproco del limite di confidenza al 95% per il T 2. Analogamente a Σ, anche G è una matrice diagonale che determina il peso da dare ad ogni componente del vettore ydes. Solitamente vengono utilizzati come pesi per variabili all''interno di ydes, le varianze spiegate dal modello per ogni variabile di Y. Inoltre viene aggiunto un vincolo hard su SPExnew (2.67) per le motivazioni riportate precedentemente. Anche i vincoli di uguaglianza o disuguaglianza su xnew equivalgono a quelli riportati nelle (2.68-2.70), come anche i vincoli fisici su xnew e ydes. La differenza è la possibilità di imporre dei vincoli di disuguaglianza anche sul vettore della variabile risposta, come riportato nella (2.71). In questo caso la minimizzazione coinvolge direttamente la variabile risposta e non le sue proiezioni sul pian degli scores (tdes) ricavate da questa come nel problema formalizzato al §2.2.2.2. In presenza di uno spazio nullo nell''inversione, questo tipo di formulazione permette di muovere la soluzione al suo interno. 2.2.2.4. Calcolo dello spazio nullo Come anticipato, nel caso in cui il rango della matrice Y sia minore del rango di X, la
soluzione al problema dell''inversione del modello non è unica, ma esistono una serie di infinite soluzioni, che permettono di ottenere il prodotto desiderato, appartenenti allo spazio che si genera a causa della differenza fra i ranghi delle due matrici. Matematicamente lo spazio nullo rappresenta il luogo dei punti delle proiezioni di X che non influenzano lo spazio di Y. Secondo Jaeckle e MacGregor (2000), ogni soluzione al problema di inversione lungo lo spazio nullo è calcolata come: null new pred x x x ' ' (2.72) In cui xnull è l''insieme delle soluzioni appartenenti allo spazio nullo. La variazione delle
condizioni di processo all''interno di questo spazio secondo la (2.672) non dovrebbe avere alcuna influenza sul prodotto finale. Lo spazio nullo viene calcolato attraverso la decomposizione a valori singolari o SVD (singular value decomposition) della matrice Q T ovvero: Tecniche di analisi statistica multivariata 41
'  T SQ SQ T V Σ G G Q T T 2 1 '' '' '  (2.73) In cui la matrice '  2 1 G G  ha dimensione [ (A'k)  A'(A-k)] in cui k è il rango della matrice Y. La matrice T 2 G definisce la giacitura dell''iperpiano in cui giace lo spazio nullo: T
2 null T
null G t ''  ' (2.74) In cui λ null assume valori arbitrari. Si ottiene quindi: ' ' T T
2 null T des pred P G t x ''  ' ' (2.75) che deve appartenere allo spazio dei dati storici di processo. Dal momento che il valore di λnull è arbitrario, le soluzioni trovate potrebbero non garantire i limiti imposti sulle condizioni di processo: è necessario tener conto di questi limiti per ricercare la soluzione più adatta alle esigenze del sistema. 2.2.2.5. Stima dell''incertezza Il calcolo della soluzione del problema di inversione e la determinazione dello spazio nullo, sono affetti dalle incertezze dovute alla stima dei parametri del modello utilizzato
nell''inversione. Il calcolo di queste incertezze è fondamentale per stimare la qualità delle soluzioni trovate. Secondo la procedura proposta da Tomba et al. (2012), vengono calcolati i limiti di confidenza al 95% sia per lo spazio nullo sia per la soluzione ottenuta tramite
l''inversione del modello con una delle procedure di inversione sopracitate.
La procedura si basa sull''utilizzo di un metodo jackknife (Duchesne and MacGregor, 2001), e prevede le seguenti fasi: 1.secondo il metodo jackknife viene rimosso un campione alla volta sia dalla matrice delle variabili di processo X sia da quella Y, generando due nuove matrici X i e Yi; 2.viene costruito il modello PLS (o nel caso in esame JY-PLS) tra X i e Yi, con lo stesso numero di variabili latenti del modello di partenza. Questo viene effettuato per tutti gli n campioni considerati nel modello, ottenendo come risultato una matrice tridimensionale degli scores Tnull [l'n'a] dove l è il numero di punti dello spazio nullo considerati, e una matrice Tnew [n'a] delle soluzioni ad ogni inversione.
Per ogni punto dello spazio nullo viene costruita un''ellisse di confidenza al 95% formata dai punti di coordinate t secondo l''equazione: c ) ( ) ( null, 1 null, ' ' ' ' l l l t t S t t (2.76) 42 Capitolo 2 In cui Sl è la matrice di covarianza calcolata dalla matrice Tnull,l per ognuna della n stime
dell''l-esimo punto dello spazio nullo, e c può esser approssimato come: ' ' ' ' α A, n A, F A n n n A c ' '' ' ' ' 1 2 (2.77) in cui A è il numero di variabili latenti e n il numero di campioni, sopra definito. α A, n A, F ' è il valore corrispondente al 100·α-esimo percentile della distribuzione F con A e n-A gradi di libertà. Dalla risoluzione della (2.76) si ottengono le ellissi di confidenza per ogni punto dello spazio
nullo: dal congiungimento dei punti estremi dell''ellisse di ciascun punto, si ottengono i limiti desiderati per lo spazio nullo.
Una procedura simile è stata utilizzata per calcolare l''ellisse di confidenza per la soluzione
stimata dall''inversione, utilizzando la (2.76) tenendo conto degli scores T new, calcolati con il metodo jackknife. Capitolo 3 Comprensione del processo produttivo dall''analisi dei dati Si vogliono applicare le tecniche di analisi statistica multivariata descritte ai dati disponibili del processo di produzione di nano particelle. I risultati ottenuti verranno confrontati con le informazioni ricavate dall''osservazione qualitativa degli andamenti delle variabili indicanti la qualità delle nanoparticelle, al variare delle variabili di processo e dalle simulazioni fluidodinamiche effettuate su diversi sistemi considerati (Lince et al., 2011; Valente et al., 2012). Le strutture di risoluzione e analisi utilizzate in questo Capitolo sono state implementate in Matlab ® (2007b ,the MathWorks Inc., Natick, MA) utilizzando i comandi del PLS Toolbox (v6.0), dell''Optimization Toolbox (v3.1.2) e dello Statistics Toolbox. 3.1. Analisi preliminare: studio del set di dati per il copolimero
poli(MePEGCA-co-HDCA)
Si prende in considerazione il set di dati disponibile per il copolimero poli(MePEGCA-co- HDCA) (in seguito identificato semplicemente come PEG), per il quale sono disponibili 340 campioni ottenuti a partire da diverse condizioni iniziali e con diverse apparecchiature. 3.1.1. Struttura dei dati e variabili considerate Allo scopo di utilizzare le tecniche statistiche descritte nel Capitolo 2, i dati disponibili possono essere organizzati in una matrice X [n'm], in cui le n righe rappresentano i diversi campioni, mentre le m colonne costituiscono le variabili che vengono modificate in ciascuna prova sperimentale. Tali prove non sono state tuttavia effettuate secondo una procedura sistematica di progettazione sperimentale. Le variabili geometriche e di processo ed i valori assunti da ognuna, sono riportati in Tabella 3.1. In particolare, per il copolimero PEG, si hanno a disposizione dati ottenuti da esperimenti su apparecchiature di diversa configurazione (CIJM, T, MIVM) e diversa scala, per un totale di 9 apparecchiature considerate. Ogni apparecchiatura è caratterizzata dalle tre variabili geometriche: d, D, Dist, come riportato in Tabella 3.1. 44 Capitolo 3 Ogni campione è quindi caratterizzato da un set di variabili di processo e di variabili
geometriche, che identificano le condizioni e l''apparecchiatura con cui è stato ottenuto. Per ogni miscelatore sono state effettuate prove a portata crescente e a diverse concentrazione di polimero e di olio, cioè in presenza di principio attivo (Capitolo 1), ma in numero diverso per ogni apparecchiatura (Tabella 3.2). Inoltre è da sottolineare come, nelle prove effettuate in alcune delle apparecchiature considerate, alcune variabili presentate in Tabella 3.1 vengano
mantenute costanti, non permettendo in tal modo di studiarne l''effetto sul processo all''interno della singola apparecchiatura e sul prodotto finale. Tabella 3.1. Variabili di processo manipolate nell''esecuzione delle prove
sperimentali per il copolimero PEG, unità di misura, simbolo identificativo e
valori assunti da ogni variabile in questo set di dati. VARIABILE DI
PROCESSO
DIMENSIONE ABBREVIAZIONE VALORI ASSUNTI Concentrazione polimero mg/mL Cpol 0.7, 1, 2, 2.5, 3, 3.2, 3.5, 4, 6, 10,
15 Concentrazione olio mg/mL Colio 0, 4.8, 8, 15 Portata in entrata mL/min FR 2.5, 3, 5, 10, 20, 30, 40, 60, 80,
100, 120 Rapporto non- solvente/solvente - W/A 1, 2 Solvente - Solvent 1 (acetone), 0 (THF) Diametro d''ingresso mm d 0.5, 1, 2 Diametro camera mixing mm D 2, 2.4, 4, 4.8, 9.6 Distanza lungo il diametro tra
gli ingressi mm Dist 0, 2, 4 Raffreddamento - Quench 1 (si), 0 (no) Come già detto, la qualità delle nanoparticelle è determinata in base alla dimensione (diametro della particella, Size) e al potenziale zeta (Pot ζ), che costituiscono la matrice Y [n'2] delle variabili risposta. In questo studio ci si è concentrati soprattutto sulla prima caratteristica, a causa della scarsa affidabilità della misura del potenziale zeta. Per quanto riguarda la variabile d''interesse, ovvero la dimensione delle nanoparticelle di polimero, si riportano in seguito, il numero di campioni, il valore massimo e minimo e la media per ciascun set di dati per ogni apparecchiatura (Tabella 3.2). Tabella 3.2. Copolimero PEG: numero di campioni, valore massimo e
minimo, e media della dimensione delle nanoparticelle, per ogni
apparecchiatura del set di dati. APPARECCHIATURA CIJM-
SD
CIJM-
d1
CIJM-
d2
CIJM-
SU
w-a-
w-a
w-w-
a-a
w-a T-d1 T-d2 N. Campioni 17 62 47 47 81 16 10 30 30 Valore massimo e minimo [nm] 192-
348 98-
659 127-
540 150-
603 120-
612 155-
473 134-
201 109-
334 127-
1453 Media [nm] 268 224 350 363 272 244 159 197 448 Comprensione del processo produttivo dall''analisi dei dati 45 Già da questi dati si rileva come, in generale, si possano ottenere in media particelle di dimensioni minori con apparecchiature a scala minore, come CIJM-d1, CIJM-SD, T-d1 e quelle a vortici multipli. 3.1.2. Modelli PCA e relazioni tra le variabili Per analizzare in modo preliminare il processo in esame, si costruiscono diversi modelli PCA, dapprima considerando tutti i dati disponibili ed in seguito concentrandosi sulle singole apparecchiature: in questo modo si ricavano informazioni utili a comprendere le relazioni fondamentali tra le variabili. 3.1.2.1. Modello PCA su tutto il set di dati Si applica la tecnica PCA per costruire un modello a partire dalla matrice di calibrazione TOT PEG X che contiene tutte le variabili presentate in Tabella 3.1, con l''aggiunta della variabile risposta, indicante il diametro delle particelle '  TOT PEG TOT PEG PCA
PEG y X X ' , per un totale di 10 variabili. L''inserimento della dimensione delle particelle nella matrice è utile per ottenere delle prime informazioni globali sulle relazioni che intercorrono tra questa e le variabili manipolabili. In questo primo modello si considerano tutti i campioni a disposizione per il copolimero PEG
(340 campioni, scalati secondo la media e varianza della colonna d''appartenenza) per ottenere delle informazioni preliminari sul processo. La matrice utilizzata risulta quindi di dimensione [340'10]. La scelta del numero di componenti principali da utilizzare è effettuata sia in base alla varianza spiegata per ogni componente (Tabella 3.3), che deve essere sufficientemente elevata, sia in base allo specifico autovalore, che deve essere superiore o prossimo all''unità. Dato che la matrice risulta scalata, ogni autovalore può essere interpretato come il numero di variabili di una certa importanza lungo ogni componente principale (PC): per esempio la prima direzione cattura la varianza di 2 variabili originarie, la seconda di 1.64 e così via (Wise et al., 2006). Tabella 3.3. Copolimero PEG, modello PCA: autovalori, varianza spiegata
e cumulata per ogni componente principale (PC) del modello. PC Autovalore R 2 PCA
PEG X R 2 cum PCA
PEG X 1 2.06 20.56 20.56 2 1.64 16.42 36.98 3 1.12 11.15 48.13 4 1.11 11.13 59.26 5 0.99 9.95 69.21 6 0.91 9.16 78.37 7 0.85 8.45 86.82 8 0.64 6.41 93.23 9 0.41 4.07 97.30 10 0.27 2.70 100.00 46 Capitolo 3 In questo caso non ci sono dubbi nella scelta di almeno 4 componenti principali nella
costruzione del modello, in quanto gli autovalori sono superiori all''unità. Per i successivi, i cui valori sono prossimi al valore unitario, si confronta il rapporto tra due autovalori successivi. Per questo, si ritiene opportuno scegliere 7 PC, in quanto il rapporto degli
autovalori tra la settima e l''ottava PC è maggiore rispetto al rapporto tra la sesta e la settima componente, inoltre la varianza spiegata (R 2, 2.10) da ciascuna PC è significativa e comparabile. Con questo numero di componenti principali, la varianza spiegata cumulata per PCA
PEG X è superiore all''80 % della varianza totale. In Figura 3.1a e 3.1b si riportano i loadings delle variabili, pesati rispetto alla relativa varianza (R 2 per variabile) lungo le prime 4 componenti principali, sulla base dei quali si interpreta la posizione degli scores di ogni campione in Figura 3.2a e 3.2b. -0.2 0.0 0.2 0.4 -0.4 -0.2 0.0 0.2 0.4 Loa ding s'' R 2 pv su P C 2 Loadings''R 2
pv su PC1 C pol,FR C olio Size W/A Solvent Quench d D Dist (a) -0.2 0.0 0.2 0.4 0.6 -0.2 0.0 0.2 0.4 0.6 Quench,d,Dist,D FR C pol Size C olio W/A Solvent Loa ding s'' R 2 pv su P C 4 Loadings''R 2
pv su PC3 (b) Figura 3.1. Copolimero PEG, modello PCA: (a) Loadings lungo le prime due componenti
principali (PC1 e PC2) e (b) lungo la terza e la quarta (PC3 e PC4), delle variabili di
processo e della variabile risposta. Le linee tratteggiate spesse, indicano la direzione
secondo cui si dispongono i campioni in base all''influenza delle variabili più importanti. Per interpretare i risultati, è necessario analizzare quali siano le variabili più importanti sulle diverse PC, in particolare lungo le prime due componenti principali che catturano la percentuale di varianza maggiore di PCA
PEG X . Le variabili che presentano i loadings maggiori, pesati sulla varianza spiegata dalle prime due componenti principali, sono anche quelle più influenti sul sistema. Da Figura 3.1a si nota che sulla prima componente principale (PC1), responsabile di circa il 20% della varianza totale di PCA
PEG X , le variabili geometriche (d, D, e Dist ) presentano i pesi maggiori e in maniera meno significativa anche le variabili che identificano la concentrazione di olio (Colio) e la dimensione (Size) delle particelle e la variabile quench. Queste ultime tre variabili sono quelle maggiormente importanti anche sulla seconda componente (PC2), che cattura invece circa il 16 % della varianza di PCA
PEG X . Sulla terza direzione (PC3 Figura 3.1b) risulta maggiormente importante la concentrazione di Comprensione del processo produttivo dall''analisi dei dati 47 polimero e in parte il tipo di solvente, mentre sulla quarta (PC4) sono catturate maggiormente la portata e il rapporto non-solvente-solvente. -3 -2 -1 0 1 2 3 4 5 -3 -2 -1 0 1 2 3 4 CIJM-SD
CIJM-SU
CIJM-d2
CIJM-d1
w-a-w-a
w-w-a-a
w-a
T-d1
T-d2 S cor es su P C 2 ( 16. 4 % ) Scores su PC1 (20.6 %) (a) -5 -4 -3 -2 -1 0 1 2 3 4 5 -2 -1 0 1 2 3 4 5 6 7 8 9 10 CIJM-SD
CIJM-SU
CIJM-d2
CIJM-d1
w-a-w-a
w-w-a-a
w-a
T-d1
T-d2 S cor es su P C 4 ( 11. 1 % ) Scores su PC3 (11.2 %) (b) Figura 3.2. Copolimero PEG,modello PCA: (a) Scores lungo le prime due componenti
principali (PC1 e PC2) e (b) lungo la terza e la quarta (PC3 e PC4) dei campioni
considerati. I diversi simboli indicano campioni che sono stati ottenuti da diversa
configurazione e scala, i gruppi cerchiati identificano campioni ottenuti in condizioni
particolari. Il grafico dei loadings (Figure 3.1a e 3.1b) è fondamentale soprattutto per ricavare le relazioni
d''interesse tra le variabili manipolabili e la dimensione delle particelle, in modo da comprendere le forze motrici del processo in esame. Risulta invece superfluo ricercare le relazioni tra le variabili di processo, poiché queste ultime sono deliberatamente manipolate nei vari esperimenti per studiarne il relativo effetto. Si può osservare da Figura 3.1a e 3.1b come la dimensione delle particelle risulti:
' correlata in modo significativo sulla prima componente, alle variabili che rappresentano la dimensione del diametro d''ingresso (d) e della camera di mixing (D): all''aumentare del
valore di queste, ossia all''aumentare della dimensione dei miscelatori, aumentano in generale le dimensioni delle particelle ottenute; ' anticorrelata rispetto alla seconda componente principale con la variabile che rappresenta il raffreddamento esterno (Quench), ma correlata, con la concentrazione di olio (Colio). Ciò significa che in generale si ottengono particelle più piccole in presenza di raffreddamento e con una bassa concentrazione di olio, cioè in presenza del principio attivo; ' anticorrelata con la concentrazione di polimero lungo la terza componente principale, quindi all''aumentare della concentrazione di polimero, si ottengono in media particelle a diametro minore; ' debolmente anticorrelata con la portata in ingresso (FR), maggiormente significativa lungo la quarta e la quinta componente per le quali presenta loadings maggiori, qui non riportati. 48 Capitolo 3 Dagli studi basati sull''osservazione dell''andamento della dimensione delle particelle rispetto alla portata in ingresso (Valente et al., 2012), ci si aspetta che questa variabile risulti avere
un''influenza significativa sulla variabile Size, al contrario di ciò che si rileva dall''analisi del modello PCA. Dai dati disponibili, sembra infatti che la portata non influisca così decisamente sulle dimensioni delle particelle, come invece la geometria o la concentrazione di
polimero iniziale per esempio, e che l''effetto delle altre variabili sia nel complesso più marcato. Secondo queste conclusioni si possono rilevare alcune differenze rispetto alle relazioni individuate nei lavori di Valente et al. (2012), nei quali veniva data un''interpretazione grafica dei dati sperimentali: la concentrazione di polimero per esempio, sembra avere un effetto
contrario a quello riscontrato in quest''analisi, in quanto erano stati studiati in particolare i campioni per apparecchiature di dimensioni minori, mentre restano ancora dubbi gli effetti del rapporto non solvente-solvente e della concentrazione di olio. Queste anomalie possono essere spiegate tenendo conto che i dati su cui è stato costruito il modello PCA sono ottenuti da diverse apparecchiature, nelle quali in generale il comportamento del sistema è diverso a causa della diversa influenza del mescolamento, e l''effetto principale rilevato è proprio quello dovuto alla geometria più che alle singole variabili. Ciò che è chiaro invece, e che verrà mostrato anche in seguito, è la capacità dei miscelatori a dimensione minore di produrre nelle condizioni osservate, particelle a diametro inferiore. In riferimento alla posizione reciproca dei loadings delle variabili nei diagrammi (sottolineata dalle linee spesse tratteggiate in Figura 3.1a e 3.1b), si spiega la disposizione in clusters dei campioni nei diagrammi degli scores di Figura 3.2a e 3.2b. Infatti:
' lungo PC1 (ascissa in Figura 3.2a), i campioni si dispongono in base alle caratteristiche geometriche (d, Dist, D): configurazioni a diametro minore sono proiettati sulla porzione sinistra del diagramma; ' lungo PC2 (ordinata in Figura 3.2a), campioni a concentrazione di olio e dimensione delle particelle minore (Colio e Size), in presenza di raffreddamento (Quench), si dispongono sulla parte inferiore del diagramma; viceversa, campioni ottenuti senza raffreddamento e con alta concentrazione di olio, mostrano dimensione maggiore e si dispongono sulla parte superiore del diagramma. Inoltre, all''interno di ogni clusters i campioni si dispongono verticalmente in base a valori crescenti di portata verso il basso; ' lungo PC3 (ascissa in Figura 3.2b), si dispongono soprattutto in base alla concentrazione di polimero (Cpol), che presenta valori maggiori per i campioni posizionati sulla parte destra del piano, e al tipo di solvente (Solvent), ma anche in base alla dimensione delle particelle, che presenta valori superiori sulla parte sinistra del diagramma; ' lungo PC4 (ordinata in figura 3.2b), si allineano verticalmente in base alla portata (FR) e al rapporto non-solvente/solvente (W/A). Per esempio, vi sono alcuni campioni (appartengono al cluster identificato da triangoli, evidenziati da un cerchio) che presentano tale rapporto Comprensione del processo produttivo dall''analisi dei dati 49 pari a 2 e si trovano chiaramente sulla parte superiore del grafico, in corrispondenza della variabile che li caratterizza nel diagramma dei loadings. A tal proposito, un''altra informazione che si ricava dalla posizione degli scores riguarda appunto i campioni evidenziati (cerchiati) che si collocano agli estremi rispetto agli altri. Questo è dovuto al fatto che presentano valori diversi di alcune variabili rispetto al resto dei campioni, come nel caso esposto per il rapporto W/A. Questa osservazione è utile in una prima analisi dei dati per identificare la presenza di campioni che presentano caratteristiche
particolari e per comprendere l''influenza di alcune variabili. Per esempio, i campioni ottenuti
con l''utilizzo del solvente THF al posto dell''acetone (cerchiati sulla sinistra del diagramma) si posizionano in corrispondenza della variabile Size (Figura 3.1b e Figura 3.2b) lungo la terza componente, in cui la variabile Solvent presenta un loading significativo. Questo indica come i campioni ottenuti con THF presentino in generale una diametro maggiore. 3.1.2.2. Modelli PCA per alcune apparecchiature
Dal momento che l''analisi dell''intero database ha evidenziato come ci siano differenze per
quanto riguarda l''importanza delle singole variabili nelle diverse apparecchiature (Figura 3.1),
si è cercato di comprendere meglio quali siano le forze motrici del processo all''interno di ogni singola apparecchiatura. Tra tutte le apparecchiature, si sono scelte per la costruzione di modelli PCA, quelle per cui sono state fatte variare almeno 4 variabili nelle prove sperimentali. Per tutti i modelli si è scelto di considerare 4 componenti principali, allo scopo di poterli poi confrontare su una base comune. Le caratteristiche di ogni apparecchiatura e le variabili considerate nei modelli, vengono riportate in Tabella 3.4. Tabella 3.4. Copolimero PEG, caratteristiche dei modelli sviluppati per 4
diverse apparecchiature: numero di campioni, dimensione dell''apparecchiatura e variabili di processo presenti per ogni modello. Apparecchiatura Numero di campioni Geometria [mm] Variabili modificate CIJM - SU 47 d = 2, D = 9.6 Cpol, Colio, FR, Quench, Size CIJM - d2 47 d = 2, D = 4.8 Cpol,Colio, FR, Quench, Size CIJM '' d1 62 d = 1, D = 4.8 Cpol, Colio, FR, Solvent, Quench, Size w-a-w-a 81 d = 1, D = 4, Dist = 2 Cpol, Colio, FR, W/A, Quench, Size 50 Capitolo 3 Tabella 3.5. Copolimero PEG: autovalori e varianza spiegata per ogni PC
per ogni modello PCA costruito sui dati ottenuti con quattro diverse
apparecchiature: CIJM-SU, CIJM ''d2, CIJM-d1, w-a-w-a. CIJM-SU CIJM-d2 CIJM-d1 w-a-w-a PC Autoval ore R 2 CIJMSU PEG X Autoval ore R 2 2 CIJMd PEG X Autoval ore R 2 1 CIJMd PEG X Autoval ore R 2 wawa
PEG X 1 1.73 34.64 1.69 33.84 2.25 37.54 1.84 30.60 2 1.27 25.40 1.08 21.58 1.25 20.83 1.37 22.78 3 0.97 19.36 0.99 19.74 1.01 16.88 1.19 19.84 4 0.71 14.27 0.93 18.66 0.94 15.71 0.89 14.85 5 0.32 6.34 0.31 6.19 0.35 5.90 0.52 8.70 6 0.19 3.14 0.19 3.22 -0.6 -0.4 -0.2 0.0 0.2 0.4 0.6 0.8 -0.8 -0.6 -0.4 -0.2 0.0 0.2 0.4 0.6 0.8 Loa ding s ''R 2 pv su P C 2 Loadings''R 2 pv su PC1 C pol C olio Quench FR Size CIJM-SU (a) -0.8 -0.6 -0.4 -0.2 0.0 0.2 0.4 0.6 0.8 -0.4 -0.2 0.0 0.2 0.4 0.6 0.8 Quench Size C olio FR Loa ding s ''R 2 pv su P C 2 Loadings''R 2 pv su PC1 C pol CIJM-d2 (b) -0.6 -0.4 -0.2 0.0 0.2 0.4 0.6 -0.6 -0.4 -0.2 0.0 0.2 0.4 0.6 0.8 Loa ding s ''R 2 pv su P C 2 Loadings''R 2 pv su PC1 C pol C olio FR Solvent Quench Size CIJM-d1 (c) -0.2 0.0 0.2 0.4 0.6 -0.6 -0.4 -0.2 0.0 0.2 0.4 0.6 Loa ding s ''R 2 pv su P C 2 Loadings''R 2 pv su PC1 C pol C olio FR Quench W/A Size w-a-w-a (d) Figura 3.3. Copolimero PEG: loadings delle variabili pesate rispetto alle varianze
spiegate per ognuna delle variabili dalle prime due componenti principali (PC1 e PC2) per
i modelli PCA costruiti con i dati dell''apparecchiatura (a) CIJM-SU, (b) CIJM-d2, (c)
CIJM-d1, (d) w-a-w-a. Comprensione del processo produttivo dall''analisi dei dati 51 Per identificare eventuali differenze tra i modelli, vengono riportatati per ciascun modello la varianza spiegata per componente principale (Tabella 3.5) e i diagrammi dei loadings pesati sulla varianza di ogni variabile spiegata dalle prime due PC (Figura 3.3). Come si nota da Tabella 3.4, nelle prove effettuate sulle prime due apparecchiature sono considerate le stesse variabili, mentre le ultime due ne hanno una in più, diversa nei due casi (Solvent e W/A). Questo è importante per verificare sia la relazione che queste due variabili hanno con la dimensione delle particelle, sia se e come la loro presenza influenzi le relazioni tra le altre variabili e la dimensione delle particelle. Si prendono in considerazione i primi due modelli che, presentando lo stesso numero di
variabili, si prestano bene all''analisi e al confronto tra i loadings (Figure 3.3a e 3.3b) per
ricavare le variabili che influiscono maggiormente sul processo. Dall''osservazione dei grafici si deduce che:
' per CIJM-SU sembra che le variabili più significative sulla prima componente principale, ossia quella più rilevante dato che cattura più del 30 % della varianza spiegata di CIJMSU
PEG X , siano la concentrazione di olio (Colio) ed il raffreddamento (Quench). La prima è anticorrelata e la seconda è correlata con la dimensione delle particelle (Size); ossia,
all''aumentare della concentrazione di olio e in assenza di raffreddamento si ottengono in
generale particelle a dimensione minore per quest''apparecchiatura. La concentrazione di polimero (Cpol) e la dimensione delle particelle (Size) sono rilevanti sulla seconda PC e tra loro anticorrelate, mentre la portata (FR) presenta una certa importanza sulle componenti successive alla seconda, di cui non si riporta il grafico; ' per CIJM-d2, come per CIJM-SU, le variabili che presentano loadings superiori su PC1 sono la concentrazione di olio ed il raffreddamento, ma si trovano in posizione ortogonale rispetto alla dimensione delle particelle, nuovamente importante sulla seconda componente principale: non sembra perciò esserci relazione tra queste variabili. Al contrario
dell''apparecchiatura precedente, è la portata ad avere una certa importanza su PC2, mentre la concentrazione di polimero è rilevante sulle componenti successive. Per gli ultimi due modelli invece (Figure 3.3c e 3.3d):
' per CIJM-d1, sono ancora la concentrazione di olio ed il raffreddamento le variabili più importanti sulla prima componente principale, che cattura quasi il 40 % della varianza spiegata per 1 CIJMd
PEG X , ma anche la dimensione delle particelle presenta un loading significativo su questa direzione, in correlazione con la concentrazione di olio: in generale si ottengono particelle di dimensioni minori in presenza di raffreddamento e con una bassa concentrazione di olio. La variabile Solvent per CIJM-d1 (il cui valore è pari ad 1 per
l''acetone, mentre è pari a 0 per il THF) è rilevante lungo la seconda PC e si presenta in anticorrelazione con la dimensione delle particelle: in generale si ottengono particelle di
dimensioni minori con l''utilizzo di acetone, come confermato dalla letteratura (Valente et 52 Capitolo 3 al., 2012). La portata e la concentrazione di polimero invece, sono rilevanti solo sulle componenti successive; ' per w-a-w-a si rileva una forte correlazione lungo PC1 tra la concentrazione di olio e la dimensione delle particelle: all''aumentare della prima si ottengono particelle di dimensione maggiore. Le altre variabili presentano una certa importanza solo lungo PC2; in particolare, il rapporto non solvente-solvente (W/A) sembra anticorrelato con la variabile Size:
all''aumentare di tale rapporto si ottengono in media particelle a diametro inferiore, ma questa relazione è messa in dubbio dal fatto che solo pochi campioni presentano tale rapporto diverso da 1. Infatti, dalle analisi di letteratura (Valente et al., 2012) si rivela che
l''influenza del rapporto non solvente-solvente dipende anche dalla concentrazione iniziale di polimero, ma i dati disponibili sono insufficienti a confermare tali relazioni. Questo tipo di analisi individuale delle singole apparecchiature mostra che le relazioni tra le variabili di processo e la dimensione delle nanoparticelle non sembrano coincidere totalmente nei diversi modelli, cioè nelle diverse apparecchiature: in particolare, la concentrazione iniziale di polimero è anticorrelata con la dimensione delle particelle per il miscelatore CIJM- SU, CIJM-d2 e per quello w-a-w-a, mentre sembra esistere la relazione contraria, ossia
all''aumentare della concentrazione di polimero aumenta la dimensione delle particelle, per il miscelatore CIJM-d1. In realtà queste relazioni presentano alcune incertezze, giustificabili considerando l''andamento grafico della dimensione delle particelle in funzione della concentrazione di polimero a parità di altre variabili: non vi è un andamento chiaro, per cui il modello inevitabilmente risente di questo fatto, rappresentando un comportamento medio del sistema (Figura 3.4a e 3.4b).
0 50 100 150 0 50 100 150 200 250 300 350 0.7 mg/ml
2.5 mg/ml
4.0 mg/ml
6-0 mg/ml
10.2 mg/ml D ime n s io n e ( Si z e ) [ n m] Portata d'ingresso (FR) [mL/min] (a) 0 50 100 150 0 100 200 300 400 500 600 1 mg/ml
3.5 mg/ml
4 mg/ml
6 mg/ml
10 mg/ml
15 mg/ml D ime n s io n e ( Si z e ) [ n m] Portata d'ingresso (FR) [mL/min] (b) Figura 3.4. Copolimero PEG: esempio della dipendenza della dimensione delle particelle
rispetto alla velocità d''ingresso per l''apparecchiatura (a) CIJM-d1 e (b) CIJM-d2 per
diverse concentrazioni iniziali, a parità di altre variabili. Comprensione del processo produttivo dall''analisi dei dati 53
L'' analisi permette inoltre di evidenziare come la prima apparecchiatura (CIJM-SU) mostri un comportamento diverso rispetto alle altre e alla logica processistica, sia per la variabile che
descrive la concentrazione di olio, sia per la portata d''ingresso (Figura 3.3a): all''aumentare della portata si ottengano particelle a diametro maggiore per quest''apparecchiatura, ma in
generale all''aumentare della portata la dimensione delle particelle diminuisce, per effetto di un miglior mescolamento. Probabilmente la spiegazione del comportamento inverso nel miscelatore CIJM-SU risiede nel fatto che, per una camera di miscelamento così ampia, le portate utilizzate negli esperimenti non sono sufficienti ad assicurare delle buone condizioni di turbolenza, come invece accade nelle altre apparecchiature di dimensioni minori. Al momento, i dati a disposizione per questa apparecchiatura non permettono tuttavia un''analisi più approfondita al riguardo, e nuovi esperimenti a portate maggiori dovrebbero essere effettuati per confermare tale ipotesi. Infine, non sembra che includere le variabili Solvent e W/A nei modelli per CIJM-d1 e w-a-w- a influenzi in modo particolare le relazioni tra le altre variabili di processo e la variabile risposta, che risultano essere analoghe a quelle riscontrate nei modelli in cui non si considerano il tipo di solvente e il rapporto non solvente-solvente. 3.1.3. Modelli PLS e relazioni tra le variabili di processo e la dimensione
delle particelle Modelli di tipo PCA permettono di individuare correlazioni tra le variabili, che in alcuni casi possono essere lette come relazioni di causa effetto sulla base della conoscenza che si ha sul processo. Allo scopo di confermare e chiarire queste relazioni e con l''obiettivo di creare dei modelli di stima delle variabili risposta a partire dai parametri modificabili sul processo, sono stati costruiti dei modelli di regressione di tipo PLS tra la matrice X delle sole variabili di processo e quella Y, che in realtà si riduce ad un vettore y, considerando solo la dimensione delle nanoparticelle come unica variabile osservata. 3.1.3.1. Modello PLS su tutto il set di dati Come nei modelli PCA, si considera prima di tutto una matrice di calibrazione TOT
PEG X che comprende tutti i 340 campioni disponibili per il copolimero PEG, che sono stati ottenuti da diverse apparecchiature. Le variabili che costituiscono le colonne della matrice, sono ancora tutte quelle riportate in Tabella 3.1. Prima di tutto è necessario scegliere il numero di variabili latenti ottimale per il modello: questo viene scelto sia in base ad una convalida incrociata, sia in base alla varianza spiegata per la matrice TOT
PEG X e per il vettore TOT
PEG y . 54 Capitolo 3 Tabella 3.6 Copolimero PEG, modello PLS: varianza spiegata e cumulata
per ogni variabile latente (LV). LV R 2 TOT PEG X R 2 cum TOT
PEG X R 2 per TOT PEG y R 2 cum TOT
PEG y 1 16.38 16.38 24.35 24.35 2 13.54 29.92 5.37 29.71 3 12.04 41.96 1.99 31.71 4 10.11 52.07 0.33 32.03 5 9.35 61.42 0.05 32.05 6 5.98 67.40 1·10 -3 32.05 7 10.05 77.45 6·10 -5 32.05 8 10.70 88.14 0 32.05 9 0 88.14 0 32.05 Si scelgono 5 variabili latenti, anche se ne sarebbero sufficienti un numero inferiore in base alla varianza spiegata per TOT
PEG y (Tabella 3.6) e in base alla radice dell''errore quadratico medio (RMSECV, 2.11, in Figura 3.5), il cui minimo assoluto cade in corrispondenza di una sola variabile latente. In realtà lo scopo è di costruire un modello adatto al trasferimento di
processo, argomento trattato nei Capitoli 1 e 5. In quest''ottica il modello deve descrivere una buona percentuale di varianza anche per TOT
PEG X , e per questo si sceglie questo numero di variabili latenti. 0 2 4 6 8 10 142 144 146 148 150 152 154 R MS EC V Variabili latenti Figura 3.5. Copolimero PEG, modello PLS: radice dell''errore quadratico medio
(RMSECV) in convalida incrociata, utile per determinare il numero di variabili latenti
ottimale. Si riportano in Figura 3.6a i weights per ciascuna variabile in TOT
PEG X e i loadings di TOT
PEG y pesati rispetto alla varianza spiegata per variabile dalle prime due variabili latenti (LV1 e LV2) del modello PLS costruito, indicati rispettivamente come: 2 X W pv R '' e 2 y q pv R '' , in cui W identifica il vettore dei weights, q quello dei loadings di y e 2 X pv R ed 2 y pv R le varianze spiegate per ciascuna variabile, rispettivamente della matrice X e y. Viene così confermato come le variabili geometriche (d, D, Dist) siano fondamentali lungo la prima LV, seguite ancora una volta dalle variabili che identificano la concentrazione di olio (Colio) ed il raffreddamento (Quench), lungo la seconda direzione. Anche la concentrazione di polimero (Cpol) e la portata Comprensione del processo produttivo dall''analisi dei dati 55 (FR) rilevano una certa importanza lungo la seconda variabile latente, mentre (come visto dai modelli PCA) il rapporto non solvente/solvente (W/A) e il tipo di solvente (Solvent), sono variabili che pesano soprattutto sulle variabili latenti superiori alla seconda, e perciò sembrano influire sulla risposta in maniera meno significativa rispetto alle precedenti. -0.4 -0.2 0.0 0.2 0.4 0.6 2.0 2.5 -0.4 -0.2 0.0 0.2 0.4 FR W ''R 2 p v X q ''R 2 p v y su LV 1 W''R 2
pvX q''R 2
pvy su LV1 Size Quench D d Dist Solvent,W/A C pol C olio (a) -2 -1 0 1 2 3 -4 -3 -2 -1 0 1 2 3 CIJM-SD
CIJM-SU
CIJM-d2
CIJM-d1
w-a-w-a
w-w-a-a
w-a
T-d1
T-d2 S cor es su LV 2 ( 13. 5 % ) Scores su LV1 (16.4 %) (b) Figura 3.6. Copolimero PEG, modello PLS: (a) weigths (W) delle variabili di processo e
loadings (q) della variabile risposta, pesati sulle rispettiva varianze catturate dalle prime
due variabili latenti (LV1 e LV2) e (b) diagramma degli scores dei campioni sulle prime
due variabili latenti (LV1 e LV2), in cui i campioni cerchiati identificano particelle con
diametro inferiore ai 200 nm. Con questo modello assumono un significato ancora più diretto le relazioni tra le variabili e la dimensione delle particelle: le relazioni sono simili a quelle ricavate dal precedente modello PCA, ma rimangono alcune incertezze soprattutto rispetto alla variabile W/A. In ogni caso è
ben evidenziato come, per dimensioni del diametro dei tubi d''ingresso e della camera di mixing maggiori, si abbiano in generale particelle a dimensione maggiore. Queste
considerazioni possono essere confermate osservando l''area nel piano degli scores sulle prime due variabili latenti, in cui si concentrano la maggior parte dei campioni con dimensioni minori di 200 nm, valore che come detto risulta ottimale in vista dell''applicazione
finale di trasferimento del prodotto (Figura 3.6b, campioni cerchiati). Quest''area individua la zona in cui le combinazioni delle variabili di processo, comprese le variabili geometriche, permettono di ottenere particelle con dimensione prossima a quella desiderata. Si osserva che i campioni evidenziati che soddisfano la soglia desiderata appartengono a clusters di diverse apparecchiature, ma il gruppo più numeroso di campioni appartiene al mixer CIJM-d1, come già dimostrato negli studi precedenti (Valente et al., 2012), permette di ottenere particelle di dimensioni minori. In specifiche condizioni si raggiungono comunque dimensioni accettabili anche con le apparecchiature CIJM-SU, w-a-w-a e CIJM-SD. Queste considerazioni giustificano lo studio per il trasferimento di prodotto tra apparecchiature diverse che verrà presentato in seguito (Capitolo 5). 56 Capitolo 3 Cpol Colio FR W/A Solv ent d D Dist Quench 0 1 2 3 4 5 VI P Figura 3.7. Copolimero PEG, modello PLS: indice VIP per ogni variabile considerate nel
modello. Per sottolineare l''importanza di ogni variabile, in entrambi i modelli per TOT
PEG X e TOT
PEG y , si utilizza l''indice VIP (2.32), dal quale si rileva un''ulteriore conferma delle considerazioni precedenti: dal momento che le variabili considerate importanti sono quelle con un indice
VIP maggiore dell''unità (Eriksson et al, 2001), in Figura 3.7 si nota come ancora una volta siano le variabili geometriche (d, D, Dist) le più rilevanti, seguite però anche dalla concentrazione di polimero e dal raffreddamento, poco al di sotto dell''unità. Per avere degli indici di confronto anche per i successivi modelli, sono stati calcolati la radice
dell''errore quadratico medio (RMSEC, 2.31 e RMSECV, 2.11) e l''errore medio relativo in calibrazione e in convalida incrociata (Tabella 3.7). La convalida è uno strumento utile per
verificare l''effettiva capacità di predizione del modello su nuovi campioni. Sia in questo modello che in quelli successivi, viene effettuata eliminando il 10% dei campioni dalla matrice di calibrazione, che verranno poi utilizzati come nuovi campioni su cui effettuare la predizione (matrice di convalida). Allo scopo di ottenere risultati generali, che non dipendano strettamente dai campioni eliminati in modo casuale in una sola prova di convalida, vengono costruiti dieci modelli diversi: ogni modello è basato su una matrice in cui sono eliminati di volta in volta in modo random il 10% dei campioni. Gli indici riportati sono una media di quelli ottenuti con ogni singolo modello. Tabella 3.7. Copolimero PEG, modello PLS: RMSEC e RMSECV ed errore
medio percentuale in calibrazione e in convalida. RMSEC [nm] Errore medio in calibrazione RMSECV [nm] Errore medio in convalida STD di Y [nm] 120.7 27.7 % 98.4 29.1 % 146.7 Si nota come gli errori medi in calibrazione e in convalida, siano molto simili e che il modello costruito è in grado di dare predizioni soddisfacenti rispetto agli standard degli sperimentatori (per i quali un errore del 20-30% è ancora accettabile). Comprensione del processo produttivo dall''analisi dei dati 57 -4 -3 -2 -1 0 1 2 3 4 -20 0 60 80 u 1 t1 Figura 3.8. Proiezione degli scores di X (t1) contro gli scores di y (u1) per identificare
l''eventuale linearità, che in questo caso si dimostra assente Infine si è verificata l''ipotesi di linearità del modello, analizzando i grafici degli scores t PC del modello contro gli scores uPC .Come si può notare, la relazione non è lineare, ma non si nota un andamento preciso che possa portare a linearizzare tale relazione (Figura 3.8). Questo può esser dovuto al fatto che si stanno considerando in un solo modello, diversi tipi di apparecchiature, in cui le relazioni tra le variabili in generale possono risultare diverse, come dimostrato nel confronto tra i modelli PCA costruiti sulle singole apparecchiature. 3.1.3.2. Modelli PLS per alcune apparecchiature Dal modello PCA relativo a tutto il database, e dai modelli PCA sui singoli miscelatori, si è appurato che la variabilità della risposta dovuta al fatto che si eseguono prove su diverse apparecchiature domina su quella dovuta alle variabili modificate in ciascuna apparecchiatura. Ciò rende poco chiara la relazione esistente tra il tipo di apparecchiatura e la variabile risposta. Per questa ragione si è optato per costruire dei modelli di tipo PLS separati per ciascuna apparecchiatura. Ci si basa sugli stessi dati con cui si sono costruiti i modelli PCA per quattro diverse apparecchiature (§3.1.2.2), per costruire quattro modelli PLS, grazie ai
quali, oltre a comprendere l''effetto delle variabili di processo sulla dimensione delle particelle, si vuole anche analizzare la potenziale capacità di predizione di ciascun modello. Si scelgono nuovamente 4 variabili latenti per la costruzione di tutti i modelli, sia per facilitare il confronto, sia perché per i primi due modelli (Tabelle 3.8 e 3.9) un numero inferiore di variabili latenti non permetterebbe di considerare alcune variabili d''interesse in X. Va tuttavia notato che per questi due modelli la regressione PLS si riduce ad una semplice regressione multivariata. Il modello della configurazione CIJM-d1 presenta la varianza spiegata per y maggiore rispetto agli altri, seguito dal modello per la configurazione w-a-w-a (Tabella 3.9). Questo è dovuto alla presenza della variabile Solvent nel primo caso, e alla maggior varianza spiegata dalla variabile Colio nel secondo. Infatti è solo nei campioni ottenuti con l''apparecchiatura w-a-w-a 58 Capitolo 3 che vengono utilizzate concentrazioni di olio diverse da 0 o 8 per un consistente numero di campioni. Il modello risente positivamente di questo aumento di variabilità, che definisce più chiaramente la relazione tra la concentrazione di olio e la dimensione delle particelle. Tabella 3.8. Copolimero PEG: varianza spiegata e cumulata per X e y per
ogni variabile latente dei modelli PLS costruiti sui dati ottenuti con
l''apparecchiatura CIJM-SU e CIJM-d2. CIJM-SU CIJM-d2 LV R 2 CIJMSU
PEG X R 2 cum CIJMSU
PEG X R 2 CIJMSU PEG y R 2 cum CIJMSU
PEG y R 2 2 CIJMd
PEG X R 2 cum 2 CIJMd
PEG X R 2 2 CIJMd
PEG y R 2 cum 2 CIJMd
PEG y 1 30.35 30.35 17.26 17.26 30.50 30.50 10.26 10.26 2 28.07 58.42 3.45 20.71 21.05 51.56 5.18 15.44 3 17.39 75.81 1.19 21.90 23.81 75.36 0.18 15.61 4 24.19 100.00 0.00 21.90 24.64 100.00 0.00 15.61 Tabella 3.9. Copolimero PEG: varianza spiegata e cumulata per X e y per
ogni variabile latente dei modelli PLS costruiti sui dati ottenuti con
l''apparecchiatura CIJM-d1 e w-a-w-a. CIJM-d1 w-a-w-a LV R 2 1 CIJMd
PEG X R 2 cum 1 CIJMd
PEG X R 2 1 CIJMd
PEG y R 2 cum 1 CIJMd
PEG y R 2 wawa
PEG X R 2 cum wawa
PEG X R 2 wawa PEG y R 2 cum wawa
PEG y 1 31.27 31.27 55.32 55.32 21.13 21.13 61.20 61.20 2 22.06 53.33 9.86 65.18 24.64 45.77 2.62 63.82 3 19.261 72.59 0.13 65.31 22.99 68.77 0.03 63.85 4 8.49 81.08 0.02 65.33 13.62 82.39 0.01 63.86 5 18.92 100.00 0.00 65.33 17.61 100.00 0.00 63.86 Dai weights delle variabili di processo e dai loadings della variabile risposta, pesati secondo le relative varianze spiegate (Figure 3.9a, 3.9b, 3.9c, 3.9d) , si osserva ancora una volta che sono le variabili che rappresentano la concentrazione di olio (Colio) e il raffreddamento (Quench), e in parte la concentrazione di polimero (per il primo e ultimo modello), ad avere la maggiore importanza sulle prime due variabili latenti. Tuttavia è interessante notare come la relazione tra queste variabili e la variabile risposta non sia identica per i quattro modelli: la variabile Quench e la variabile Colio nel primo e secondo modello rispettivamente, sembrano non avere influenza sulla dimensione delle particelle, in quanto posizionati ortogonalmente rispetto a questa variabile, mentre negli ultimi due modelli è chiaro come al diminuire della concentrazione di olio e in presenza di raffreddamento, si ottengano particelle di dimensione inferiore. Comprensione del processo produttivo dall''analisi dei dati 59 -0.5 0.0 0.5 1.0 -1.0 -0.5 0.0 0.5 Size C olio C pol Quench W ''R 2 p v X q ''R 2 pv y su LV 2 W''R 2 pvX q''R 2 pvy su LV1 FR CIJM-SU (a) -1.5 -1.0 -0.5 0.0 0.5 1.0 1.5 -1.0 -0.5 0.0 0.5 1.0 W ''R 2 p v X q ''R 2 pv y su LV 2 W''R 2 pvX q''R 2 pvy su LV1 C olio Quench C pol , FR Size CIJM-d2 (b) -0.5 0.0 3.0 3.5 -1.0 -0.5 0.0 0.5 W ''R 2 p v X q ''R 2 pv y su LV 2 W''R 2 pvX q''R 2 pvy su LV1 C pol C olio FR Solvent Quench Size CIJM-d1 (c) -0.5 0.0 0.5 4.0 4.5 -0.5 0.0 0.5 Size Quench C olio FR W ''R 2 p v X q ''R 2 pv y su LV 2 W''R 2 pvX q''R 2 pvy su LV1 C pol W/A w-a-w-a (d) Figura 3.9. Copolimero PEG: weights delle variabili manipolabili e loadings della
variabile risposta pesati sulle varianze spiegate dalle prime due variabili latenti per
ciascuna variabile (LV1 e LV2), per i modelli costruiti sui dati ottenuti con
l''apparecchiatura (a) CIJM-SU, (b) CIJM-d2, (c) CIJM-d1 e (d) w-a-w-a. Vengono confermate anche le anomalie riscontrate nel modello per l''apparecchiatura CIJM- SU, per la quale le relazioni della concentrazione di olio e della portata con la dimensione
delle particelle sono contrarie a quelle presenti nelle altre apparecchiature. D''altronde proprio
la portata e la concentrazione di polimero assumono un''importanza significativa solo per
l''ultima apparecchiatura, in cui però sembrano trovarsi in posizione ortogonale rispetto alla variabile Size, e quindi non avere particolare influenza su questa. ' da notare inoltre come la variabile Solvent abbia rilevanza soprattutto sulla seconda variabile latente, e come questa, nel modello per l''apparecchiatura CIJM-d1, riesca a spiegare circa il 9% di varianza, una percentuale molto maggiore rispetto agli altri modelli, a conferma che è anche grazie alla presenza di questa variabile che il modello risulta migliore rispetto ai primi due (Tabella 3.9).
Lo scopo dell''analisi di questi quattro modelli PLS non è solo la conferma delle relazioni tra le variabili di processo e la dimensione delle particelle, già evidenziate precedentemente, ma soprattutto il confronto tra i vari modelli nella capacità di predizione della variabile risposta. 60 Capitolo 3 Dal confronto (Tabella 3.10) dell''errore quadratico medio e dell''errore medio relativo delle prove di convalida incrociata, viene nuovamente confermato come i modelli migliori siano quelli costruiti con i dati ottenuti dall''apparecchiatura CIJM-d1 e w-a-w-a, per i quali l''errore in predizione risulta non solo minore rispetto agli altri due modelli, ma anche al modello generale, indice della capacità di questi due modelli di predire bene i valori reali della variabile y (Tabella 3.10). Tabella 3.10. Copolimero PEG: RMSEC e RMSECV ed errore medio
percentuale in calibrazione e convalida per i modelli PLS in cui sono
considerati i dati ottenuti con le apparecchiature CIJM-SU, CIJM-d2,
CIJM.d1 e w-a-w-a. CONFIGURAZIONE RMSEC [nm] Errore medio in calibrazione RMSEP [nm] Errore medio in convalida STD di Y [nm] CIJM-SU 101.1 25.7 % 112.6 28.5 % 115.6 CIJM-d2 90.7 24.5 % 92.1 34.4 % 99.8 CIJM-d1 56.0 17.9 % 65.1 22.2% 95.9 w-a-w-a 57.7 15.7 % 63.0 18.3% 96.5 3.2. Analisi preliminare dei dati: studio del set di dati per
l''omopolimero poli-ε-caprolattone (PCL)
Dopo aver analizzato i dati disponibili per il copolimero PEG, ci si concentra ora sull''analisi
del set di dati ottenuti utilizzando l''omopolimero poli-ε-caprolattone (PCL). In realtà le prove sono state effettuate utilizzando due tipi di polimeri, a pesi molecolari diversi: a 14 000 e 80 000 g/mol (rispettivamente PCL14 e PCL80). Sono stati costruiti diversi modelli PCA e PLS, prendendo in considerazione diverse matrici di calibrazione. 3.2.1. Struttura dei dati e variabili considerate Le variabili di processo considerate, sono le stesse presentate in Tabella 3.1, la differenza sta
soprattutto nell''intervallo di variazione dei parametri di processo (Tabella 3.11), e nel fatto che alcune variabili (Solvent, Dist, Quench) sono state mantenute costanti nelle prove effettuate. La struttura del piano sperimentale è simile a quella vista precedentemente, anche se gli esperimenti sono stati effettuati in maniera più sistematica. Le configurazioni utilizzate questa volta sono solo due: il miscelatore a getti collidenti confinati (CIJM) e il miscelatore a T (T), entrambi a due diverse scale (d=1 mm e d=2 mm), per un totale di quattro apparecchiature. Nonostante le prove sperimentali presentino uno schema più regolare di
quanto descritto al §3.1 (stesse prove per diverse apparecchiature), l''apparecchiatura CIJM-d1 presenta un numero maggiore di prove, per un totale di 471 campioni. Comprensione del processo produttivo dall''analisi dei dati 61 Tabella 3.11. Variabili di processo considerate nella costruzione dei modelli
statistici per il polimero PCL: unità di misura, simbolo identificativo e valori
assunti per ogni variabile in questo set di dati. VARIABILE DI
PROCESSO
DIMENSIONE ABBREVIAZIONE VALORI ASSUNTI Concentrazione polimero mg/mL Cpol per PCL14 0.25, 0.5, 2.5, 5, 10, 15, 25 Cpol per PCL80 0.02, 0.2, 1, 1.5, 2, 3, 4, 6 Concentrazione olio mg/mL Colio 0 Portata in entrata mL/min FR 3, 20, 40, 60, 80, 120 Rapporto non-
solvente/solvente - W/A 1, 2, 3, 6, 8 Solvente - Solvent 1 (acetone) Diametro d''ingresso mm d 1, 2 Diametro camera mixing mm D 2, 4.8 Distanza lungo il diametro
tra gli ingressi mm Dist 0 Raffreddamento - Quench 1 (si) Le caratteristiche dei campioni ottenuti sono riportate in Tabella 3.12. Anche in questo caso si considera solo la dimensione delle nanoparticelle come variabile risposta e non il potenziale
zeta, a causa dell''incertezza sulla misura di tale variabile. Tabella 3.12. Polimero PCL: numero di campioni, valore massimo e minimo
e media della dimensione delle nanoparticelle, per ogni apparecchiatura del
set di dati. APPARECCHIATURA CIJM-d1 CIJM-d2 T-d1 T-d2 N. Campioni 348 40 43 40 Valore massimo e minimo [nm] 98.9-1194 181.2-587.7 150.5-660.2 190.2-698.2 Media [nm] 328.1 328.8 301.8 358.2 Come si può notare, l''apparecchiatura CIJM-d1 presenta un ampio intervallo di variazione per la variabile risposta, dal momento che, come già detto, è stato effettuato un maggior numero di prove, in condizioni diverse e in un dominio sperimentale più ampio rispetto altre apparecchiature. Proprio questa caratteristica rende questo set di dati particolarmente adatto allo scopo finale del lavoro, come sarà descritto in seguito. 3.2.2. Modelli PCA e relazioni tra le variabili Per analizzare il processo utilizzando questo diverso set di dati, si procede secondo la stessa
strategia impiegata per analizzare i dati del polimero PEG (§3.1) un modello per l''intero set di dati, e diversi modelli in cui si considerano le diverse apparecchiature singolarmente. 62 Capitolo 3 3.2.2.1. Modello PCA su tutto il set di dati Lo scopo nella costruzione di questo modello non è solo ricavare le relazioni tra le variabili di processo e la dimensione delle nanoparticelle, ma anche verificare le eventuali differenze
nell''utilizzo di questo diverso polimero e di chiarire le relazioni tra alcune variabili. Come già detto, il numero di campioni totale è pari a 471, mentre le variabili considerate, che andranno a costituire le colonne della matrice '  TOT PCL TOT PCL y X , denominata PCA
PCL X , sono 8: Cpol, FR, W/A, d, D, Dist e vengono aggiunte una variabile che identifica il tipo di polimero PCL14 o PCL80 di valore rispettivamente 0 e 1 nella variabile Typepol che li caratterizza e la variabile risposta Size. Tabella 3.13. Polimero PCL, modello PCA: autovalori, varianza spiegata e
cumulata per ogni componente principale. PC Autovalore R 2 PCA
PCL X R 2 cum PCA
PCL X 1 1.93 27.55 27.55 2 1.42 20.23 47.78 3 1.25 17.83 65.62 4 0.98 14.02 79.64 5 0.62 8.80 88.44 6 0.60 8.55 96.99 7 0.21 3.01 100.00 -0.2 0.0 0.2 0.4 -0.4 -0.2 0.0 0.2 0.4 Size Type pol Dist D d W/A FR Loa ding s'' R 2 pv su P C 2 Loadings''R 2
pv su PC1 C pol (a) -2 0 2 4 6 -2 -1 0 1 2 3 4 5 CIJM-d1
CIJM-d2
T-d1
T-d2 S cor es su P C 2 ( 20. 23 % ) Scores su PC1 (27.55 %) (b) Figura 3.10. Polimero PCL, modello PCA: (a) scores dei campioni lungo le prime due
componenti principali (PC1 e PC2) e (b) loadings delle variabili pesati rispetto alla
varianza spiegata per ogni variabile dalle prime due componenti principali del modello. Le
linee tratteggiate spesse, indicano la direzione secondo cui si dispongono i campioni in
base all''influenza delle variabili più importanti. Il numero di componenti principali scelto è pari a 4, in base agli autovalori e alla varianza spiegata da ognuna (Tabella 3.13). ' sufficiente questo numero perché la varianza spiegata sia
circa l''80%, superiore a quella spiegata dal modello con i dati del copolimero PEG, per lo stesso numero di componenti principali (Tabella 3.3). Comprensione del processo produttivo dall''analisi dei dati 63 Analizzando il diagramma dei loadings pesati sulla varianza spiegata dalle prime due componenti principali, che catturano circa il 50% della varianza totale di '  TOT
PCL TOT
PCL y X (PC1 e PC2 in Figura 3.10a) si nota quanto segue.
' La concentrazione (C pol), il tipo di polimero (Typepol) e la dimensione delle particelle (Size) sono le variabili più importanti sulla prima componente. Diversamente rispetto al modello per il copolimero PEG, la concentrazione di polimero e la dimensione delle particelle sembrano chiaramente correlate, confermando le conclusioni esposte in letteratura a proposito del processo in studio (Lince et al. 2011). Risulta inoltre chiaro che si ottengono particelle a dimensioni minori utilizzando il polimero a peso molecolare maggiore. Questa considerazione deve però esser presa con cautela: infatti non vengono utilizzate le stesse concentrazioni di polimero per entrambi i pesi molecolari, ma vengono utilizzate in media concentrazioni più alte per il PCL14 e inferiori per il PCL80, per cui l''effetto del tipo di polimero va letto in relazione proprio alla concentrazione. ' Diversamente dai modelli visti per il copolimero contenente PEG, le variabili geometriche (d, D, Dist) sono più rilevanti soprattutto sulla seconda componente, e sembrano non essere particolarmente correlate con la dimensione delle particelle, come si può notare dalla posizione lungo le direzioni ortogonali di queste due variabili. ' La portata di alimentazione e il rapporto W/A influiscono solo sulle componenti principali successive, i cui grafici non sono riportati. Se ora si analizza la posizione degli scores (Figura 3.10b) in relazione alla posizione dei loadings delle variabili, si osserva come questi si dispongano chiaramente lungo la seconda componente principale, sulla base delle variabili geometriche (d e D). Infatti, essi sono divisi in tre gruppi rispetto al tipo di apparecchiatura. I campioni relativi a CIJM-d2 e T-d1 risultano sovrapposti, perché il primo presenta valori maggiori di entrambe le dimensioni, ed il secondo, presenta i valori minori; nel complesso, il rapporto D/d risulta simile per entrambe le apparecchiature. Lungo la prima componente invece, si dispongono a destra del piano i campioni che presentano una dimensione delle particelle maggiore e una concentrazione di polimero iniziale più alta, a sinistra quelli con dimensione minore, ottenuti con un valore di portata agli ingressi maggiore. 3.2.2.2. Modelli PCA per alcune apparecchiature Ogni apparecchiatura è stata studiata singolarmente per identificare, come fatto precedentemente, eventuali diverse relazioni tra le variabili in base alla geometria utilizzata. In questo caso, però, diversamente da ciò che è stato visto per i dati ottenuti con il copolimero
PEG, con il polimero PCL l''uso di diverse apparecchiature non sembra modificare la relazione tra le variabili. La spiegazione di questo comportamento va ricercata sia nel fatto 64 Capitolo 3 che si utilizzano apparecchiature di per sé più simili che nel caso precedente, sia nel diverso polimero utilizzato, per il quale il processo di formazione di nanoparticelle sembra meno influenzato dalla geometria del miscelatore. Si riporta come unico esempio il modello PCA
costruito sui dati ottenuti con l''apparecchiatura CIJM-d1, dal momento che i risultati si presentano molto simili anche per le altre apparecchiature. Tabella 3.14. Polimero PCL: autovalori, varianza spiegata e cumulata per ogni
componente principale del modello PCA in cui si considerano solo i dati ottenuti con
l''apparecchiatura CIJM-d1. PC Autovalore R 2 1 CIJMd PCL X R 2 cum 1 CIJMd
PCL X 1 1.89 37.79 37.79 2 1.27 25.47 63.25 3 1.00 19.99 83.24 4 0.66 13.14 96.39 5 0.18 3.61 100.00 -0.4 -0.2 0.0 0.2 0.4 0.6 0.8 -0.4 -0.2 0.0 0.2 0.4 0.6 W/A Size C pol FR Loa ding s'' R 2 pv su P C 2 Loadings''R 2
pv su PC1 Type pol Figura 3.11. Polimero PCL: loadings delle variabili pesati rispetto alla varianza spiegata
per ogni variabile dalle prime due componenti principali del modello PCA in cui si
considerano solo i dati ottenuti con l''apparecchiatura CIJM-d1. Le considerazioni sono molto simili a quanto visto nel caso generale (§3.2.2.1), ma
dall''analisi del diagramma dei loadings pesati rispetto alle prime due componenti principali (Figura 3.11), si rileva che la differenza principale è rappresentata dai loadings della portata (FR), che risultano significativi lungo la seconda componente, chiarendo la relazione di tale variabile con la variabile risposta: per ottenere particelle di piccola dimensione è necessario
utilizzare alte portate d''ingresso. Si nota inoltre come il rapporto non solvente-solvente W/A non abbia praticamente influenza sulla dimensione delle particelle, almeno lungo queste due prime componenti, mentre è chiara la correlazione con la concentrazione di polimero. Comprensione del processo produttivo dall''analisi dei dati 65
3.2.3. Modelli PLS e relazioni tra le variabili di processo e la dimensione
delle particelle Dati i risultati ottenuti nella costruzione di modelli PCA basati sui dati del polimero PCL, si vuole studiare la potenziale capacità nella predizione di y di modelli PLS basati su questo stesso set di dati, da confrontare poi con quelli precedentemente sviluppati per il copolimero PEG. 3.2.3.1. Modello PLS su tutto il set di dati ' stato costruito un modello PLS includendo tutto il set di dati a disposizione per il polimero PCL. Secondo i risultati della convalida incrociata (qui non riportati), il numero di variabili latenti sufficienti al modello è pari a 2; si nota infatti come aumentando il numero di LV, non aumenti ulteriormente la varianza spiegata per TOT
PCL y dopo la seconda variabile latente. Con questo numero di LV la varianza spiegata per la matrice TOT
PCL X tuttavia risulta scarsa (Tabella3.15). Per questa ragione con la stessa logica seguita per il modello PLS sui dati del copolimero PEG, si impiegano 4 variabili latenti per questo modello, in modo da assicurare una buona varianza spiegata anche per TOT
PCL X (Tabella 3.15). Tabella 3.15. Polimero PCL, modello PLS: varianza spiegata e cumulata
per X e y per variabile latente (LV). LV R 2 TOT
PCL X R 2 cum per TOT
PCL X R 2 TOT
PCL y R 2 cum TOT
PCL y 1 20.53 20.53 53.18 53.18 2 18.00 38.53 5.08 58.26 3 11.78 50.31 0.86 59.12 4 22.34 72.65 0.01 59.12 5 16.40 89.05 0.00 59.13 6 0.00 89.05 0.00 59.13
Dall''analisi del diagramma dei weights delle variabili e dei loadings della variabile risposta pesati sulla varianza spiegata per variabile dalle prime due variabili latenti (LV1 e LV2 in Figura 3.12) , risulta che né le variabili geometriche né il rapporto W/A in questo caso hanno una particolare importanza nella regressione di TOT
PCL y . Sono la concentrazione lungo la prima direzione e il tipo di polimero e la portata sulla seconda, ad avere la maggiore influenza,
avvalorando l''ipotesi che per questo tipo di polimero la geometria dell''apparecchiatura sia meno influente rispetto al copolimero PEG. 66 Capitolo 3 -0.5 0.0 0.57.5 8.0 8.5 9.0 0.0 0.5 W ''R 2 pv X q ''R 2 pv y su LV 2 W''R 2
pvX q''R 2
pvy su LV1 Size Type pol FR W/A,D,d C pol Figura 3.12. Polimero PCL, modello PLS:weights delle variabili di processo e loadings
della variabile risposta rispetto alle prime due variabili latenti (LV1 e LV2).. Per avere un''idea precisa della capacità di predizione della variabile d''interesse di questo modello, si riportano in Tabella 3.16 l''errore medio relativo e la radice dell''errore quadratico medio in calibrazione e convalida. Tutti questi indici risultano minori rispetto al modello costruito sui dati del copolimero PEG (Tabella 3.7), e si nota un netto miglioramento
soprattutto dell''errore relativo in convalida, che si assesta intorno al 20 % . Tabella 3.16. Polimero PCL, modello PLS: RMSEC e RMSECV ed errore
medio percentuale in calibrazione e in convalida. RMSEC [nm] Errore medio RMSECV [nm] Errore medio in convalida STD di Y [nm] 89.9 20.6 % 91.0 20.3 % 140.7 3.2.3.2. Modelli PLS per alcune apparecchiature Come esempio si riporta il modello PLS costruito per un solo tipo di configurazione, quella a getti collidenti confinati a diametro minore (CIJM-d1), in quanto, come già specificato
nell''analisi dei modelli PCA, i risultati per le altre apparecchiature risultano del tutto simili. Tabella 3.17. Polimero PCL:varianza spiegata e cumulata per X e y per
variabile latente per il modello PLS in cui sono considerati i dati ottenuti
con la configurazione CIJM-d1. LV R 2 1 CIJMd
PCL X R 2 cum 1 CIJMd
PCL X R 2 1 CIJMd
PCL y R 2 cum 1 CIJMd
PCL y 1 29.31 29.31 55.95 55.95 2 26.10 55.42 6.20 62.15 3 19.60 75.01 0.96 63.11 4 24.99 100.00 0.00 63.11 In questo caso migliorano la varianza spiegata sia per 1 CIJMd
PCL X che per 1 CIMd
PCL y (Tabella 3.17) rispetto al modello generale per il polimero PCL, ma non rispetto al modello sviluppato per la Comprensione del processo produttivo dall''analisi dei dati 67 stessa apparecchiatura per il copolimero PEG, i cui valori per questi indici risultano molto simili (Tabella 3.9). -0.5 0.0 0.5 7.0 7.5 8.0 -0.5 0.0 0.5 1.0 W ''R 2 pv X q ''R 2 pv y su LV 2 W''R 2
pvX q''R 2
pvy su LV1 Size Type pol C pol FR W/A Figura 3.13. Polimero PCL: weights delle variabili di processo e loadings della variabile
risposta rispetto alle prime due variabili latenti (LV1 e LV2), per il modello PLS in cui
sono considerati i dati ottenuti con la configurazione CIJM-d1. In base all''analisi dei weights delle variabili di processo e dei loadings della variabile risposta pesati rispetto alla relativa varianza spiegata sulle prime due variabili latenti (Figura 3.13), anche questo modello conferma la limitata importanza della variabile W/A nella regressione di 1 CIMd
PCL y , i cui pesi sulle prime due variabili latenti risultano nulli, mentre le relazioni tra la dimensione delle particelle e le altre variabili, confermano quelle osservate precedentemente (Figura 3.12). Tabella 3.18. Polimero PCL: RMSEC e RMSECV ed errore medio
percentuale in calibrazione e convalida per il modello PLS in cui sono i dati
ottenuti con la configurazione CIJM-d1. RMSEC [nm] Errore medio RMSECV [nm] Errore medio in convalida STD di Y [nm] 90.2 19.9 % 91.6 19.9 % 148.6 A fronte di una deviazione standard maggiore, gli indici di confronto della capacità di predizione del modello (Tabella 3.18), rimangono simili al caso generale che non sembra quindi condizionato come il modello per il polimero PEG, dal fatto di considerare in un'unica matrice dei dati ottenuti da diverse configurazioni. 3.3. Impiego di nuove variabili per il miglioramento dei modelli Si è visto come i vari modelli sviluppati presentino capacità di predizione di y diversa e incertezze diverse sulla relazione di questa con alcune variabili. Per questo, allo scopo di migliorare la comprensione del processo in esame ed aumentare la potenziale capacità di predizione della variabile di interesse, si sono modificate le matrici X utilizzate finora nella 68 Capitolo 3 costruzione di modelli per i due polimeri, introducendo nuove variabili o selezionando solo alcuni dei dati disponibili. 3.3.1.Variabili relative al tipo di configurazione Le tecniche di analisi statistica multivariata utilizzate possono essere sfruttate per ricercare
delle informazioni di particolare interesse, grazie all''introduzione di ulteriori variabili nella matrice X. In questo caso si sono volute confrontare in modo globale le relazioni tra le diverse configurazioni a diverse scale e la dimensione delle particelle. A questo scopo, si è costruito un modello PCA in cui ciascun tipo di apparecchiatura è considerata come una nuova variabile binaria nella matrice in cui si utilizzano i dati del copolimero PEG, in sostituzione della variabili geometriche (d, D e Dist), per un totale di 16 variabili: ogni nuova variabile,
che rappresenta un''apparecchiatura, assume valore 1 se i dati sono ottenuti con il miscelatore in considerazione, altrimenti assume valore 0. La matrice risultante CONF PEG X , ha quindi dimensione [340'16]. In base agli autovalori e alla varianza spiegata per ogni PC (Tabella 3.19), sono necessarie almeno 10 componenti principali, un numero molto maggiore dei casi precedenti. Tabella 3.19. Copolimero PEG: autovalori e varianza spiegata e cumulata
da ognuna delle componenti principali del modello PCA in cui sono
considerate come variabili tutti i diversi tipi di apparecchiature. PC Autovalore R 2 CONF PEG X R 2 cum CONF PEG X 1 2.22 13.85 13.85 2 1.71 10.68 24.53 3 1.46 9.10 33.64 4 1.26 7.86 41.49 5 1.16 7.25 48.74 6 1.13 7.09 55.83 7 1.11 6.96 62.79 8 1.07 6.69 69.49 9 1.01 6.30 75.79 10 0.99 6.20 81.99 11 0.87 5.46 87.45 12 0.66 4.13 91.58 13 0.62 3.87 95.45 14 0.38 2.39 97.84 15 0.35 2.16 100.00 Dall''analisi della posizione dei loadings lungo la seconda componente principale (Figura 3.14), si intuisce immediatamente quali siano le apparecchiature più adatte per ottenere particelle a dimensioni minori: i loadings dei miscelatori che presentano dimensioni minori
dei tubi d''ingresso e della camera di mixing (CIJM-d1, CIJM-SD, T-d1, w-a-w-a). Questi si trovano infatti nella parte del piano opposta rispetto alla posizione dei loadings della dimensione delle particelle, indicando in questo modo che si ottengono mediamente particelle Comprensione del processo produttivo dall''analisi dei dati 69 a dimensione minore con il loro utilizzo. Le altre apparecchiature si trovano invece nella parte superiore del piano, correlate alla dimensione delle particelle. In modo particolare, si
evidenzia che l''apparecchiatura CIJM-d1 presenta un loading quasi simmetrico rispetto
all''origine lungo la seconda PC, rispetto al loading della dimensione delle particelle. -0.3 -0.2 -0.1 0.0 0.1 0.2 0.3 0.4 -0.2 -0.1 0.0 0.1 0.2 0.3 Other CIJM-SD CIJM-d2 CIJM-SU T-d1 T-d2 w-a-w-a CIJM-d1 Quench Solvent Cpol Size Loa ding s'' R 2 p v su P C 2 Loadings''R 2
pv su PC1 Figura 3.14. Copolimero PEG: loadings delle variabili pesati rispetto alla varianza
spiegata per ogni variabile dalle prime due componenti principali (PC1 e PC2) del
modello PCA in cui sono considerate come variabili tutti i diversi tipi di apparecchiature. Le relazioni tra le altre variabili e la dimensione delle particelle non si differenziano da quelle rilevate precedentemente, se non per la variabile Solvent: questa sembra correlata con la dimensione delle particelle, mentre in tutti gli altri modelli e dalle osservazione sperimentali,
la relazione appare opposta. In realtà, questo è dovuto al fatto che solo per l''apparecchiatura CIJM-d1 la variabile Solvent presenta un valore diverso (0=THF e 1=acetone), ma il modello presenta una relazione globale, considerando tutti i dati a disposizione. Per quanto riguarda il modello PLS, invece, non si riportano i risultati in quanto non si hanno miglioramenti significativi: le varianze spiegate per CONF
PEG X e CONF
PEG y e gli indici per il confronto delle prestazioni del modello in convalida sono di poco maggiori rispetto al modello in cui si
considerano solo le variabili geometriche, ma questo modello rimane un''utile opportunità per
avere un''idea immediata del confronto fra le diverse configurazioni a diverse scale. 3.3.2. Gruppi adimensionali Dal momento che le relazioni tra le variabili manipolabili e la variabile risposta sembrano essere nel complesso non lineari, si sono introdotti vari gruppi adimensionali, nei quali le variabili sono combinate in modo non lineare, sulla base anche di considerazioni già effettuate in studi precedenti (Lince et al.,2012), in modo da aumentare la capacità di predizione della dimensione della particelle dei modelli costruiti. 70 Capitolo 3 3.3.2.1. Polimero PCL
Si è visto come l''effetto della portata sulla dimensione delle nanoparticelle sia
particolarmente importante soprattutto con l''uso del polimero PCL. Per questo, sono state introdotte fra le variabili della matrice X, quattro varianti del numero adimensionale di Reynolds (Tabella 3.20): Rew riferito al non solvente (acqua), Rea riferito al solvente (acetone), Rew/Rea ossia il rapporto tra questi, e Revol, un ulteriore numero di Reynolds che tiene conto però delle proprietà della miscela nella camera di mixing. Queste nuova variabili sono riassunte in Tabella 3.20. Introducendo queste nuove variabili, nella risultante matrice Re
PCL X [471'14] , si vogliono aggiungere delle informazioni riguardo alle proprietà dei fluidi, che influenzano la turbolenza e quindi l''efficienza della miscelazione e la combinazione tra la geometria e la velocità negli ingressi. Tabella 3.20. Polimero PCL: numeri adimensionali introdotti come nuove
variabili nel modello PLS, in cui ρ è la densità [kg/m3], ν è la velocità [m/s],
μ è la viscosità [Pa·s] in riferimento all''acqua (w), all''acetone (a) e alla
miscela fra questi (m). D e d sono rispettivamente il diametro della camera di
mixing e il diametro d''ingresso del miscelatore. Rew Rea Rew/Rea Revol w w w w d v   ' Re a a a a d v   ' Re a w Re Re m m m vol D v   ' Re Si è quindi costruito un modello PLS, in cui si sono impiegate (ancora in base alla varianza spiegata per Re
PCL X e per Re
PCL y ) 5 variabili latenti. Come illustrato in Tabella 3.21, la varianza spiegata aumenta per entrambe le matrici, soprattutto per Re PCL X , rispetto al modello senza variabili adimensionali (Tabella 3.15), ma a scapito di un numero maggiore di LV. Tabella 3.21. Polimero PCL: varianza spiegata e cumulata per X e y per
variabile latente per il modello PLS in cui sono introdotte 4 variabili
adimensionali. LV R 2 Re
PCL X R 2 cum Re
PCL X R 2 Re
PCL y R 2 cum per Re
PCL y 1 25.03 25.03 41.72 41.72 2 16.13 41.16 11.72 53.44 3 12.62 53.78 5.51 58.95 4 15.23 69.01 1.51 60.46 5 6.27 75.28 2.02 62.48 6 14.36 89.64 0.52 63.00 7 4.27 93.91 0.67 63.66 8 2.89 96.80 0.63 64.29 9 1.72 98.52 0.02 64.32 10 0.00 98.52 0.00 64.32 Comprensione del processo produttivo dall''analisi dei dati 71 -0.4 -0.2 0.0 0.2 3 4 5 6 -0.4 -0.2 0.0 0.2 0.4 0.6 0.8 1.0 1.2 W ''R 2 pv X q ''R 2 pv y su L V 2 W''R 2 pvX q''R 2 pvy su LV1 C pol FR Type pol Re w Re a Re vol Size Re w /Re a ,D,d,Dist,W/A Figura 3.15. Polimero PCL: weights delle variabili di processo e loadings della variabile
risposta rispetto alle prime due variabili latenti (LV1 e LV2), per il modello PLS in cui
sono introdotte 4 variabili adimensionali. Dall''analisi del diagramma dei weights e dei loadings della variabile risposta, pesati sulla varianza spiegata dalle prime due variabili latenti per ciascuna variabile, si osserva come le nuove variabili adimensionali presentino pesi maggiori soprattutto sulla prima direzione (Figura 3.14), ma in realtà i valori dei loro weights sono inferiori rispetto a quelli della portata (FR) e non sembrano quindi portare maggiori informazioni rispetto a questa variabile. Lungo la seconda direzione invece, il Rea sembra avere una certa importanza, ma questa variabile non sembra comunque influenzare la varianza spiegata per Re
PCL y , che non aumenta come già detto, in modo significativo (Tabella 3.21). Anche la capacità di predizione (Tabella 3.22) di tale modello è molto simile a quella del modello generale per il polimero PCL, dato che l''errore medio in convalida si assesta sul 20%. Tabella 3.22. Polimero PCL: RMSEC e RMSECV ed errore medio
percentuale in calibrazione e convalida per il modello PLS in cui sono
introdotte 4 variabili adimensionali. RMSEC [nm] Errore medio RMSECV [nm] Errore medio in convalida STD di Y [nm] 87.7 20.1 % 81.3 20.6 % 140.7
In ogni caso si conferma che, in generale, all''aumentare del numero di Re, diminuisce la dimensione delle particelle, per effetto della maggiore turbolenza. Questa, come detto, è
un''informazione che risulta molto utile per la comprensione generale del processo, ma che in questo caso non porta a grossi miglioramenti dei modelli già costruiti. 72 Capitolo 3 3.3.2.2. Copolimero PEG Oltre ai numeri di Reynolds precedentemente considerati, sono state impiegate ulteriori variabili adimensionali come rapporto tra variabili geometriche o concentrazioni (Tabella 3.23). La risultante matrice viene indicata con ADIM
PEG X [340'13]. Si noti che è stato necessario considerare solo i dati del copolimero PEG, in quanto i gruppi adimensionali proposti non potevano essere calcolati dalle variabili a disposizione per il polimero PCL. Tabella 3.23. Copolimero PEG: numeri adimensionali introdotti come nuove
variabili nel modello PLS. d/D Dist/D Colio/Cpol amera diametro c ngresso diametro i d/D ' camera diametro i ra ingress distanza f dist/D ' ero ione polim concentraz ione olio concentraz Colio/Cpol ' Tabella 3.24 Copolimero PEG: varianza spiegata e cumulata per X e y per
variabile latente per il modello PLS in cui sono introdotte 3 variabili
adimensionali. LV R 2 ADIM PLS PEG , X R 2 cum ADIM PLS PEG , X R 2 ADIM PLS PEG , y R 2 cum ADIM PLS PEG, y 1 16.37 16.37 27.78 27.78 2 18.45 34.81 5.18 32.96 3 13.45 48.27 1.64 34.60 4 9.50 57.77 0.29 34.89 5 8.78 66.55 0.15 35.04 6 2.46 69.01 0.62 35.66 7 8.02 77.03 0.10 35.76 8 5.24 82.27 0.02 35.78 9 0.67 82.95 0.02 35.80 10 8.85 91.79 0.00 35.80 11 0.00 91.79 0.00 35.80 ' stato quindi costruito un modello PLS in cui il numero delle variabili latenti, scelto in base alla varianza spiegata per ADIM
PEG X e ADIM
PEG y , è pari a 3. Per lo stesso numero di variabili latenti, si nota (Tabella 3.24) un certo miglioramento nel valore di varianza spiegata, per entrambe le matrici, rispetto al modello in cui non vi sono le nuove variabili adimensionali (Tabella 3.6).
Dall''osservazione dei weights delle variabili, pesati rispetto alla varianza spiegata dalle prime
due variabili latenti (Figura 3.16), si intuisce che l''aumento della varianza spiegata per ADIM PLS PEG , y è dovuto principalmente ai rapporti d/D e Colio/Cpol, che incidono in maniera simile sulla dimensione delle particelle: all''aumentare di queste due variabili, si ottengono particelle di dimensioni in generale maggiori. Comprensione del processo produttivo dall''analisi dei dati 73 -0.2 0.0 0.2 0.4 2.0 2.5 -0.2 0.0 0.2 0.4 W ''R 2 pv X q ''R 2 pv y su L V 2 W''R 2
pvX q''R 2
pvy su LV1 Size C pol C olio FR W/A d D dist Quench d/D dist/D C olio/Cpol Solvent Figura 3.16. Copolimero PEEG: weights delle variabili di processo e loadings della
variabile risposta rispetto alle prime due variabili latenti (LV1 e LV2), per il modello PLS
in cui sono introdotte 3 variabili adimensionali. Tabella 3.25. Copolimero PEG: RMSEC e RMSECV ed errore medio
percentuale in calibrazione e convalida per il modello PLS in cui sono
introdotte 3 variabili adimensionali. RMSEC [nm] Errore medio RMSECV [nm] Errore medio in convalida STD di Y [nm] 118.5 27.4 % 73.8 24.5 % 146.8 Il vantaggio di tale modello risiede quindi nella migliore capacità di predizione rispetto al modello generale per il copolimero PEG, in quanto migliorano, seppur in modo non
particolarmente significativo, sia l''errore medio relativo che l''errore quadratico medio in convalida. 3.3.3. Interazioni a due o tre variabili Un altro metodo per considerare la non linearità del processo, prevede di introdurre tra le variabili della matrice di calibrazione, ulteriori variabili ottenute dal prodotto di due o di tre variabili di processo. In questa operazione, vengono considerate tutte le variabili già presenti nel dataset come possibili fattori, ma ogni combinazione viene considerata una sola volta (Eriksson et al, 2001). In questo caso si è scelto di utilizzare i dati del polimero PCL, costruendo due matrici e quindi due modelli: 2 , FATT PLS PCL X [471'17] nel caso di prodotto tra due variabili e 3 , FATT PLS PCL X [471'41] nel caso di prodotto tra tre variabili. Non si riportano, dato il numero elevato, le variabili introdotte, ma solo i risultati in termini di varianza spiegata, che appaiono promettenti. Si osserva infatti da Tabella 3.26 e 3.27 che per entrambi i casi, se si confrontano questi due modelli con il modello base (Tabella 3.6) rispetto allo stesso numero di variabili latenti, la varianza spiegata è maggiore sia per X che per y. Questo indice risulta invece molto maggiore se si considerano 5 e 6 variabili latenti, ossia il numero di variabili 74 Capitolo 3 rispettivamente scelte, con la stessa logica dei modelli precedenti, per il modello con 21 variabili o 41 (Tabelle 3.26 e 3.27). Tabella 3.26. Polimero PCL: varianza spiegata e cumulata per X e y per
variabile latente per il modello PLS con l''introduzione di nuove variabili
date dai prodotti a due fattori delle variabili esistenti. LV R 2 2 , FATT PLS PCL X R 2 cum 2 , FATT PLS PCL X R 2 2 , FATT PLS PCL y R 2 cum 2 , FATT PLS PCL y 1 29.59 29.59 47.28 47.28 2 21.65 51.25 11.40 58.68 3 10.38 61.63 4.27 62.95 4 8.92 70.55 2.14 65.09 5 5.88 76.42 1.56 66.65 Tabella 3.27. Polimero PCL: varianza spiegata e cumulata per X e y per
variabile latente per il modello PLS con l''introduzione di nuove variabili
date dai prodotti a tre fattori delle variabili esistenti. LV R 2 3 , FATT PLS PCL X R 2 cum 3 , FATT PLS PCL X R 2 3 , FATT PLS PCL y R 2 cum 3 , FATT PLS PCL y 1 30.41 30.41 38.10 38.10 2 17.79 48.21 21.61 59.71 3 8.09 56.30 4.53 64.24 4 12.10 68.40 1.68 65.92 5 8.54 76.94 1.15 67.07 6 4.06 81.00 1.18 68.25 Dal momento che la disposizione è simile per entrambi i modelli, in Figura 3.17 si riportano i weights pesati rispetto alla varianza spiegata relativa ad ognuna delle nuove variabili
introdotte, appartenenti solo al secondo modello. Dall''analisi di questo diagramma, si sono individuati due gruppi principali di variabili che presentano importanza maggiore: uno lungo la prima variabile latente (che cattura circa il 40% della varianza totale di 3 , FATT PLS PCL X ) e uno lungo la seconda (che cattura circa il 20% della varianza totale di 3 , FATT PLS PCL X ). Si è accertato che al primo gruppo appartengono i gruppi di fattori ottenuti come combinazione della concentrazione di polimero con altre variabili, infatti questo gruppo si dispone in correlazione con la dimensione delle particelle (Size). Al secondo gruppo, che si trova in anticorrelazione con la dimensione delle particelle, appartengono le combinazioni di variabili in cui è presente la portata. Comprensione del processo produttivo dall''analisi dei dati 75 -0.2 0.0 0.2 0.4 5 6 -0.4 -0.2 0.0 0.2 2.0 2.5 FR''var1''var2 Size W ''R 2 p v X q ''R 2 p v y su LV 1 W''R 2
pvX q''R 2
pvy su LV1 Cpol''var1''var2 Figura 3.17. Polimero PCL: weights delle variabili di processo e loadings della variabile
risposta rispetto alle prime due variabili latenti (LV1 e LV2), per il modello PLS in cui
sono introdotte nuove variabili come prodotto di 3 fattori delle variabili esistenti. Come ulteriore termine di confronto con il modello base per il polimero PCL, si riportano in Tabella 3.28 i valori di RMSEC e di RMSECV, e l''errore medio relativo in calibrazione e in convalida. Per entrambi i modelli questi due indici presentano valori inferiori rispetto al modello di partenza (Tabella 3.7), indicando come la combinazione tra le variabili aumenti la potenziale capacità di predizione del modello. Tabella 3.28. Polimero PCL: RMSEC e RMSECV ed errore medio
percentuale in calibrazione e convalida per il modello PLS con
l''introduzione di nuove variabili date dal prodotto a due o tre fattori delle
variabili esistenti. RMSEC [nm] Errore medio in calibrazione RMSECV [nm] Errore medio in convalida STD di Y [nm] Combinazione a 2 fattori 81.2 18.5 % 73.8 24.5 % 140.7 Combinazione a 3 fattori 79.2 18.0 % 64.6 19.7 % 140.7 3.4. Individuazione delle problematiche legate al raffreddamento Dagli studi effettuati per comprendere l''effetto del raffreddamento (Lince et al., 2012), si è visto come questo influenzi molto la dimensione delle particelle, stabilizzandone il processo di accrescimento ed impedendo ulteriori deformazioni delle particelle all''esterno
dell''apparecchiatura di miscelazione. Non stupisce quindi che nella costruzione dei modelli PCA e PLS per il copolimero PEG, sia per i modelli in cui si considera tutto il set di dati, sia per quelli per le singole apparecchiature (§ 1.1), una delle variabili molto importanti sulla prima o seconda direzione sia proprio il raffreddamento. Per cercare di aumentare
l''importanza di quelle variabili che sono catturate solo dalle componenti successive alla 76 Capitolo 3 seconda, si è scelto quindi di costruire due matrici distinte di calibrazione nelle quali i campioni presentassero tutti o la presenza del raffreddamento ( QUENCH PEG X [272'9]) o raffreddamento assente ( noQUENCH
PEG X [68'9]) (rispettivamente quench= 1 o quench =0 ), in modo da mantenere tale variabile costante. In Figura 3.18 si presenta la soluzione relativa ai soli campioni che vengono sottoposti a raffreddamento. Si nota che le variabili principali sono quelle geometriche, ma acquistano maggiore importanza sulla seconda componente anche le altre variabili (Cpol, Colio, FR), tranne la variabile Solvent, che invece è rilevante principalmente lungo terza direzione (qui non riportata). Le relazioni tra le variabili e la dimensione delle particelle rimangono comunque simili a quelle rilevate precedentemente. Tabella 3.29. Copolimero PEG: varianza spiegata e cumulata per X e y
dalle variabili latenti nei modelli PLS in cui sono considerati solo i
campioni che presentano il raffreddamento o che non lo presentano QUENCH NO QUENCH LV R 2 QUENCH
PEG X R 2 cum QUENCH
PEG X R 2 QUENCH
PEG y R 2 cum QUENCH PEG y R 2 per noQUENCH
PEG X R 2 cum noQUENCH
PEG X R 2 noQUENCH
PEG y R 2 cum noQUENCH
PEG y 1 22.82 22.82 23.14 23.14 26.28 26.28 54.31 54.31 2 12.62 35.44 6.52 29.66 18.63 44.91 10.95 65.26 3 11.24 46.68 1.52 31.18 15.15 60.06 1.10 66.36 4 13.97 60.65 0.07 31.25 12.12 72.18 0.67 67.03 0.0 0.5 1.6 1.8 2.0 -0.2 -0.1 0.0 0.1 0.2 0.3 Dist D Solvent FR Cpol d Colio W ''R 2 pv X q ''R 2 pv y su L V 2 W''R 2
pvX q''R 2
pvy su LV1 Size Figura 3.18. Copolimero PEG: weights delle variabili di processo e loadings della
variabile risposta rispetto alle prime due variabili latenti (LV1 e LV2), per il modello PLS
in cui sono considerati solo i campioni ottenuti con raffreddamento. Dalla Tabella 3.29 si nota che il numero di LV necessarie per il modello è inferiore a quelle del caso generale (Tabella 3.6), ma questo è dovuto soprattutto al fatto che vengono considerate un numero minore di variabili manipolabili. Infatti, oltre alla variabile quench, anche la variabile W/A rimane costante nei campioni considerati in questo modello.
Dall''osservazione della varianza spiegata da ogni LV (Tabella3.29), si nota che la varianza Comprensione del processo produttivo dall''analisi dei dati 77 spiegata per QUENCH
PEG X aumenta considerando 4 variabili latenti, mentre quella per QUENCH
PEG y diminuisce lievemente rispetto al modello generale (Tabella 3.6). Al contrario, se si considera il caso in cui i campioni non vengono sottoposti a raffreddamento, ancora con sole 4 variabili latenti, la varianza spiegata per noQUENCH
PEG X e per QUENCH
PEG X è maggiore sia al caso precedente, sia al modello generale (Tabella 3.29 e Tabella 3.6). Come si osserva dalla Figura 3.19, in assenza di raffreddamento, tutte le variabili, compresa la portata e i rapporto non solvente-solvente, acquistano maggiore importanza sulle prime due componenti principali. ' probabilmente per questo motivo per cui la capacità di predizione del modello sembra molto migliore che nel caso precedente. Questo è confermato anche dai
valori di RMSEC e dell''errore medio relativo in calibrazione e in convalida, molto minori con questo modello (Tabella 3.30). -0.4 -0.2 0.0 0.2 3.0 3.5 -0.4 -0.2 0.0 0.2 0.4 d D FR Cpol W/A Dist W ''R 2 pv X q ''R 2 pv y su L V 2 W''R 2
pvX q''R 2
pvy su LV1 Size Figura 3.19. Copolimero PEG: weights delle variabili di processo e loadings della
variabile risposta rispetto alle prime due variabili latenti (LV1 e LV2), per il modello PLS
in cui sono considerati solo i campioni ottenuti senza raffreddamento. Tabella 3.30. Copolimero PEG: confronto tra i due modelli che considerano
la presenza o meno del raffreddamento: RMSEC e RMSECV ed errore medio
percentuale in calibrazione e convalida. RMSEC [nm] Errore medio in calibrazione RMSECV [nm] Errore medio in convalida STD di Y [nm] Modello con quench 128.2 30.0 % 120.3 31.3 % 154.9 Modello senza quench 57.2 11.9 % 67.5 6.1 % 100.3 78 Capitolo 3 Cpol Colio FR W /A Solven t d D Dist Que nch 0 1 2 3 4 5 6 VI P (a) Cpol Colio FR W /A Solven t d D Dist Que nch 0 1 2 3 VI P (b) Figura 3.20. Copolimero PEG: (a) influenza delle variabili sulla predizione per i modelli
che considerano la presenza del raffreddamento o (b) in cui il raffreddamento è assente. L''analisi degli indici VIP delle variabili mette in luce il fatto che nel modello che include il raffreddamento è preponderante l''effetto della geometria del sistema (d) (Figura 3.20a), mentre nel secondo modello appaiono significative per la predizione tutte le variabili di processo manipolabili (Figura 3.20b). L''effetto del raffreddamento sembra quindi
''nascondere' l''effetto delle altre variabili, che viene invece rilevato analizzando prove sperimentali in cui il raffreddamento non è effettuato. 3.5. Conclusioni Mediante la costruzione di diversi modelli PCA e PLS per i database dei polimeri PEG e PCL, si sono ricavate diverse informazioni sul processo riguardanti le relazioni che intercorrono tra la dimensione delle particelle e le variabili di processo:
' la variabile risposta (diametro della particelle) risulta correlata in modo significativo con le variabili geometriche d e D: all''aumentare del valore di queste, ossia con apparecchiature più grandi, aumenta in generale la dimensione delle particelle. ' Mediamente, la risposta risulta anticorrelata con la variabile che rappresenta il raffreddamento e correlata con la variabile che rappresenta la concentrazione di olio: si
ottengono particelle a diametro maggiore in assenza di raffreddamento e con un''alta concentrazione di olio. Si è inoltre dimostrato come il raffreddamento abbia un effetto dominante sulle altre variabili di processo. ' Per tutti i modelli, tranne per quello in cui si utilizzano i dati del copolimero PEG ottenuti con l''apparecchiatura CIJM-SU, la portata è chiaramente anticorrelata con la risposta: come chiarito dalle simulazioni fluidodinamiche (Lince et al., 2011), all''aumentare della turbolenza aumenta la miscelazione e si ottengono particelle più regolari e di diametro minore. Comprensione del processo produttivo dall''analisi dei dati 79
' Con le apparecchiature a scala maggiore, per il polimero PEG si ottengono in generale particelle a diametro minore utilizzando alte concentrazioni di polimero; al contrario per il polimero PCL e con le apparecchiature a scala minore per il copolimero PEG, la relazione è contraria. ' L''utilizzo di acetone come solvente porta ad ottenere particelle a dimensione minore, ma esistono pochi dati ottenuti con un solvente diverso (THF) per accertare tale affermazione. ' L''influenza della variazione del rapporto W/A è di difficile interpretazione; in ogni caso la risposta non sembra dipendere in modo particolare da questa variabile. Dal confronto dei modelli costruiti per i due polimeri si rilevano alcune differenze. Infatti, i campioni analizzati ottenuti con il copolimero PEG sono particolarmente dipendenti dal tipo di apparecchiatura, dalla presenza o meno del raffreddamento e dalla concentrazione di olio. Per i campioni del polimero PCL, invece, le variabili più importanti (che presentano pesi maggiori sulle prime direzioni) sono la concentrazione di polimero e la portata. Diretta conseguenza di queste considerazioni è la maggior capacità di predizione dei modelli costruiti per il polimero PCL, che presentano in media prestazioni migliori in fase di convalida. Capitolo 4 Analisi congiunta di dati di più apparecchiature In questo Capitolo si sfrutta la tecnica JY-PLS per costruire dei modelli in cui considerare in modo congiunto i dati di diverse apparecchiature: questa tecnica permette di mantenere
l''individualità delle informazioni portate dalle variabili di processo di ogni sistema, anche se
queste variabili vengono correlate con un''unica variabile risposta globale. Vengono costruiti tre diversi modelli, partendo da un modello generale in cui si considerano i dati di tutte le apparecchiature per entrambi i polimeri e restringendo poi lo studio al dataset del polimero PCL. 4.1. Impiego del metodo JY-PLS per correlare più apparecchiature Mediante l''analisi dei modelli costruiti sui dati ottenuti da diverse apparecchiature, in particolar modo per quanto riguarda i dati del copolimero PEG, si è rilevato come le variabili di processo non presentino la stessa influenza e talvolta la stessa relazione rispetto alla dimensione delle particelle. Figura 4.1. Rappresentazione grafica di un modello JY-PLS costruito tra tre diverse
apparecchiature: T-d1, w-a-w-a, CIJM-d1. 82 Capitolo4 Per confrontare le differenze rilevate tra le diverse apparecchiature in un unico modello, si utilizza il metodo JY-PLS (§2.2). Al contrario di un semplice modello PLS, le matrici dei dati delle diverse apparecchiature vengono mantenute distinte, in modo da mettere in risalto la specificità delle relazioni che intercorrono tra le variabili di processo di ogni miscelatore e la variabile risposta. Nei casi esposti si considerano in un unico modello diverse matrici corrispondenti alle diverse apparecchiature, per esempio, nel caso di tre apparecchiature (T-d1, w-a-w-a, CIJM-d1) la rappresentazione grafica del modello risulterebbe quella riportata in Figura 4.1. 4.1.1. Modello JY- PLS sull''intero set di dati ' stato costruito un modello JY-PLS utilizzando i dati sia per il polimero PEG che per il polimero PCL, considerando in diversi blocchi (diverse matrici X) le varie configurazioni nelle diverse dimensioni (Tabella 4.1). Ogni matrice è stata scalata con la procedura presentata nel Capitolo 2 (§2.2.1.1). In questo modo si possono studiare in specifico i comportamenti delle variabili per i diversi mixer, mantenendo il vantaggio di sfruttare
l''informazione dovuta a tutti i dati a disposizione. Tabella 4.1. Matrici utilizzate nel modello JY-PLS globale in cui si
considerano tutti i dati a disposizione per i due polimeri (PEG e PCL) per
ogni apparecchiatura in esame. La varianza spiegata da ognuna delle variabili latenti, per i dati relativi a ciascuna apparecchiatura all''interno del modello (quindi per ogni matrice X e per il vettore risposta y considerato), è riportata in Tabella 4.2 e 4.3. Dai valori riportati in Tabella 4.2 si nota che, per alcune apparecchiature, dal momento che il numero di variabili di processo modificate negli esperimenti è inferiore al numero di variabili latenti considerate, si raggiunge solo con le prime variabili latenti una varianza spiegata per X pari al 100% della totale. Per le apparecchiature che presentano un maggior numero di variabili di processo modificate negli esperimenti (fino ad un totale di 8 variabili per CIJM- d1), viene raggiunta una varianza spiegata per X soddisfacente con circa 5 variabili latenti. Apparecchiatura CIJM-
SD
CIJM-
SU
w-a-w-a w-w-a-a T-d1 T-d2 CIJM-
d1
CIJM-
d2
Matrici [17'2] [47'4] [81'5] [16'2] [73'6] [70'6] [410'7] [87'6] Variabili FR
Quench Cpol
Colio
FR
Quench Cpol
Colio
FR
W/A
Quench Colio
FR
Cpol
FR
W/A
PEG
PCL14
PCL80 Cpol
FR
W/A
PEG
PCL14
PCL80 Cpol
FR
W/A
Solvent
Quench
PEG
PCL14
PCL80 Cpol
FR
W/A
Quench
PEG
PCL14
PCL80 Analisi congiunta di dati più apparecchiature 83 Per questo motivo anche i risultati per la variabile risposta y (Tabella 4.3) sono stati riportati per 5 variabili latenti. La risposta presenta valori di varianza spiegata molto diversi per le
singole apparecchiature: risulta intorno al 50% per le apparecchiature con diametro d''ingresso inferiore, è pari al 20% per le apparecchiature con diametro dei tubi di ingresso pari a 2 mm,
ed è addirittura negativa per l''apparecchiatura a scala maggiore (CIJM-SU). Quest''ultimo risultato è dovuto al fatto che, come sarà confermato in seguito, per questo miscelatore le relazioni tra le variabili di processo e la variabile risposta seguono un andamento opposto rispetto alle altre apparecchiature. Questi risultati evidenziano ciò che è già stato dedotto dai vari modelli PCA e PLS costruiti, in particolare per il copolimero PEG: il comportamento delle variabili nel processo di formazione di nanoparticelle non è identico nelle diverse
apparecchiature. Il vantaggio nell''utilizzo di questa tecnica sta nel fatto che è sufficiente un solo modello per ricavare in modo sintetico informazioni simili a quelle ottenute con più modelli, agevolando il confronto fra i diversi sistemi. Tabella 4.2. Polimeri PEG e PCL, modello JY-PLS: varianza cumulata di X
per le prime 5 variabili latenti per ogni apparecchiatura. LV R 2 cum CIJMSD
JYPLS X R 2 cum CIJMSU
JYPLS X R 2 cum wawa
JYPLS X R 2 cum wwaa
JYPLS X R 2 cum 1 Td
JYPLS X R 2 cum 2 Td
JYPLS X R 2 cum 1 CIJMd
JYPLS X R 2 cum 2 CIJMd
JYPLS X 1 0.47 0.30 0.21 0.50 0.30 0.23 0.16 0.25 2 1.00 0.58 0.46 1.00 0.55 0.48 0.32 0.51 3 0.76 0.69 0.77 0.69 0.45 0.61 4 1.00 0.82 0.92 0.89 0.65 0.74 5 1.00 1.00 1.00 0.77 0.85 6 0.86 0.94 7 0.91 1.00 8 1.00 Tabella 4.3. Polimeri PEG e PCL, modello JY-PLS: varianza cumulata di y
per le prime 5 variabili latenti per ogni apparecchiatura. LV R 2 cum CIJMSD JYPLS y R 2 cum CIJMSU JYPLS y R 2 cum wawa JYPLS y R 2 cum wwaa JYPLS y R 2 cum 1 Td JYPLS y R 2 cum 2 Td JYPLS y R 2 cum 1 CIJMd JYPLS y R 2 cum 2 CIJMd JYPLS y 1 0.51 -0.03 0.51 0.54 0.49 0.19 0.46 0.21 2 0.51 -0.03 0.51 0.54 0.49 0.19 0.46 0.21 3 0.52 -0.02 0.49 0.55 0.50 0.20 0.47 0.22 4 0.52 -0.02 0.49 0.55 0.50 0.20 0.47 0.22 5 0.52 -0.02 0.49 0.55 0.50 0.20 0.47 0.22 Analogamente alla procedura di analisi del modello eseguita per i modelli PLS costruiti, si riportano in Figura 4.1 i pesi delle variabili di processo e della variabile risposta, lungo le prime due variabili latenti. In questo caso, ciascun diagramma riporta i weights di ogni singola variabile sulle prime due variabili latenti, per ogni apparecchiatura rappresentata in ciascun diagramma con simboli diversi. In questo modo si hanno delle informazioni immediate sulle diverse relazioni che alcune variabili possono presentare nelle diverse apparecchiature rispetto 84 Capitolo4 alla dimensione delle particelle, e nel caso le relazioni siano simili, si confronta la diversa importanza in base al valore dei pesi riportati. Le conclusioni che si ricavano sono:
' per le apparecchiature CIJM-d1 e CIJM-d2, la concentrazione di polimero è correlata con la variabile risposta in Figura 4.1a, mentre la relazione è opposta per le altre apparecchiature (soprattutto per CIJM-SU ). ' in tutte le apparecchiature, tranne che per CIJM-SU e CIJM-d1, all''aumentare della concentrazione di olio, aumenta la dimensione delle particelle (Figura 4.1b); ' in generale all''aumentare della portata diminuisce il diametro delle particelle; solo per CIJM-SU si rileva il comportamento opposto (Figura 4.1c); ' vi è qualche incertezza per la variabile che indica il rapporto non solvente/solvente (Figura 4.1d); sembra che all''aumentare di questo rapporto aumenti la dimensione delle particelle
per le apparecchiature a diametro d''ingresso minore (CIJM-d1 e T-d1), la relazione è più incerta per CIJM-d2 e T-d2 (con le quali sembra non esserci relazione), mentre sembra diminuire per w-a-w-a. ' necessario ricordare a tal proposito, come l''effetto di questa variabile dipenda dalla concentrazione di polimero iniziale (§ 1.2.1). Nel caso di w-a-w-a la concentrazione assume un valore piuttosto alto, e quindi un aumento di W/A porta ad ottenere particelle di dimensioni minori, perché viene alimentata in totale una quantità minore di polimero. Per le altre apparecchiature si considerano invece diverse concentrazioni, in un ampio intervallo di variazione; ' il solvente THF al posto dell''acetone viene utilizzato in una sola apparecchiatura: CIJM-d1. Si ricorda che la variabile che identifica il tipo di solvente è binaria e assume il valore 1 per
l''acetone e 0 per il THF. Da Figura 4.1e sembra che usando questo solvente al posto
dell''acetone si ottengano in generale particelle a diametro inferiore. Questo risultato però è
dovuto al fatto che nei dati dell''apparecchiatura CIJM-d1 si considerano diversi tipi di polimeri impiegati con acetone a diverse concentrazioni, anche superiori di quelle utilizzate con il THF, che in generale portano ad ottenere particelle di grandi dimensioni. Se si analizzano i dati della sola apparecchiatura CIJM-d1, viene invece dimostrato il
comportamento contrario, ovvero che con l''uso del THF si ottengono particelle a dimensione maggiore. ' per tutte le apparecchiature, tranne che per CIJM-SU, in presenza di raffreddamento si ottengono particelle a dimensione inferiore: per le apparecchiature CIJM-d2, CIJM-SD e w- a-w-a, questa variabile è particolarmente importante lungo la prima variabile latente (Figura 4.1f). Analisi congiunta di dati più apparecchiature 85 -4 -3 -2 -1 0 1 2 3 -3 -2 -1 0 1 CIJM-SU
w-a-w-a
T-d1
T-d2
CIJM-d1
CIJM-d2 w * q su LV 2 w* q su LV1 Size C pol (a) -4 -3 -2 -1 0 1 2 -2 -1 0 CIJM-SU
w-a-w-a
w-w-a-a
CIJM-d1
CIJM-d2 w * q su LV 2 w* q su LV1 Size C olio (b) -2 -1 0 1 -9 -8 -7 -6 -5 -4 -3 -2 -1 0 1 CIJM-SD
CIJM-SU
w-a-w-a
w-w-a-a
T-d1
T-d2
CIJM-d1
CIJM-d2 w * q su LV 2 w* q su LV1 Size FR (c) -1.5 -1.0 -0.5 0.0 0.5 1.0 -1.0 -0.5 0.0 0.5 1.0 1.5 W/A w-a-w-a
T-d1
T-d2
CIJM-d1
CIJM-d2 w * q su LV 2 w* q su LV1 Size (d) -0.5 0.0 0.5 1.0 -1.5 -1.0 -0.5 0.0 Solvent CIJM-d1 w * q su LV 2 w* q su LV1 Size (e) -2 -1 0 -5 0 5 Quench CIJM-SD
CIJM-SU
w-a-w-a
CIJM-d1
CIJM-d2 w * q su LV 2 w* q su LV1 Size (f) -4 -3 -2 -1 0 1 2 3 -1.0 -0.5 0.0 0.5 1.0 1.5 2.0 PCL 80 PCL 14 PEG PCL 80 PCL 14 PEG PCL 80 PCL 14 PEG T-d1
T-d2
CIJM-d1
CIJM-d2 w * q su LV 2 w* q su LV1 Size PCL 14 PCL 80 PEG (g) Figura 4.1 Polimeri PEG e PCL, modello JY-PLS: pesi (w) di tutte le variabili e pesi presi
singolarmente per: (a) Cpol, (b) Colio, (c) FR, (d) W/A, (e) Solvent, (f) Quench, (g) Typepol. 86 Capitolo4
' il confronto tra i tipi di polimero presenta qualche difficoltà: sembra che con l''utilizzo del polimero PCL80 si ottengano particelle a diametro minore soprattutto per le apparecchiature a dimensione maggiore (CIJM-d2 e T-d2), mentre per CIJM-d1 e T-d1 si ottengono
particelle più piccole con l''utilizzo del PEG. Con il PCL 14 in generale sembra che si ottengano particelle a diametro superiore, ma si ricorda che con questo polimero si
utilizzano concentrazioni maggiori rispetto agli altri (Figura 4.1g). Quindi l''effetto
dell''utilizzo di PCL 14 potrebbe esser mascherato dall''utilizzo di maggiori concentrazioni di polimero (che per CIJM-d1 e CIJM-d2 è già stata dimostrata esser correlata alla Size).
Queste relazioni, e soprattutto le anomalie riscontrate per l''apparecchiatura CIJM-SU, sono
confermate dall''osservazione in Figura 4.2 dei coefficienti di regressione delle variabili per ogni configurazione (Eq. 2.36). Questo tipo di risultato chiarisce come ogni variabile influenzi la risposta, in relazione alle altre variabili della matrice di appartenenza e quale sia
l''importanza relativa di ognuna. Infatti, per esempio, per l''apparecchiatura w-w-a-a in Figura 4.2d, la concentrazione di olio presenta un coefficiente positivo, la portata uno negativo: in
relazione alla dimensione delle particelle, che è l''unica variabile risposta presente, significa
che all''aumentare della concentrazione di olio e al diminuire della portata d''ingresso, aumenta
il valore della variabile risposta, come osservato dall''analisi dei weights. Oltre al verso positivo o negativo, è importante anche il valore dei coefficienti, in modo da comprendere quale sia la variabile con un peso maggiore nella regressione. Le informazioni ricavate per i vari sistemi (Figure 4.2a-h) confermano quelle ricavate
dall''osservazione dai weights. In particolare, in base all''osservazione dei coefficienti per le configurazioni T e CIJM (Figura 4.2e, 4.2f, 4.2g, 4.2h), si nota come le variabili per le due scale a d=1mm e d=2mm abbiano andamenti molto simili, seppur con pesi diversi. Le maggiori differenze si notano nei coefficienti rispetto al tipo di polimero, come evidenziato
anche dall''analisi dei weights relativi a queste variabili. Si osserva inoltre come la variabile che rappresenta la concentrazione di olio abbia il
coefficiente maggiore per l''apparecchiatura w-a-w-a (Figura 4.2c), a conferma
dell''importanza di questa variabile per questo set di dati. Per verificare la capacità di predizione di questo tipo di modelli, come è stato fatto precedentemente con i modelli PLS, si è effettuata una convalida incrociata, in questo caso con un metodo jackknife (Duchesne and MacGregor, 2001), in cui un campione per volta viene eliminato del set di dati su cui si costruisce il modello JY-PLS e viene utilizzato come campione esterno da predire. In questo modo vengono calcolati la varianza spiegata per X (P 2) e per y (Q2) per ogni variabile latente (Tomba et al, 2012), l''errore relativo medio, dalla differenza relativa tra il valore predetto e quello reale di ogni campione e l''errore quadratico medio in convalida incrociata. Analisi congiunta di dati più apparecchiature 87 Figura 4.2. Polimeri PEG e PCL, modello JY-PLS: coefficienti (W*qj) per le diverse
variabili nelle diverse apparecchiature in esame: (a) CIJM-Sd, (b) CIJM-SU, (c) w-a-w-a,
(d) w-w-a-a, (e) T-d1, (f) T-d2, (g) CIJM-d1 ed (h) CIJM-d2. C po l C ol io FR W/ A So lv en t d D di st Q eu nch PEG PC L1 4 PC L8 0 -0.6 -0.5 -0.4 -0.3 -0.2 -0.1 0.0 0.1 0.2 0.3 0.4 0.5 C o e ff ic ie n ti C IJ M- SD (a) C po l C ol io FR W/ A So lv en t d D di st Q eu nch PEG PC L1 4 PC L8 0 -1.4 -1.2 -1.0 -0.8 -0.6 -0.4 -0.2 0.0 0.2 0.4 C o e ff ic ie n ti C IJ M- SU (b) C po l C ol io FR W/ A So lv en t d D di st Q eu nch PEG PC L1 4 PC L8 0 -0.6 -0.4 -0.2 0.0 0.2 0.4 0.6 0.8 1.0 C o e ff ic ie n ti w a w a (c) C po l C ol io FR W/ A So lv en t d D di st Q eu nch PEG PC L1 4 PC L8 0 -0.4 -0.2 0.0 0.2 0.4 C o e ff ic ie n ti w w a a (d) C po l C ol io FR W/ A So lv en t d D di st Q eu nch PEG PC L1 4 PC L8 0 -0.4 -0.2 0.0 0.2 0.4 0.6 C o e ff ic ie n ti T -d 1 (e) C po l C ol io FR W/ A So lv en t d D di st Q eu nch PEG PC L1 4 PC L8 0 -1.0 -0.5 0.0 0.5 C o e ff ic ie n ti T -d 2 (f) C po l C ol io FR W/ A So lv en t d D di st Q eu nch PEG PC L1 4 PC L8 0 -0.8 -0.6 -0.4 -0.2 0.0 0.2 0.4 0.6 0.8 1.0 C o e ff ic ie n ti C IJ M- d 1 (g) Cp ol Co lio FR W/ A So lve nt d D di st Q eu nch PEG PC L1 4 PC L8 0 -1.0 -0.8 -0.6 -0.4 -0.2 0.0 0.2 0.4 0.6 0.8 C o e ff ic ie n ti C IJ M- d 2 (h) 88 Capitolo4 Si nota (Tabelle 4.4 e 4.5) come la varianza spiegata per ogni sottomatrice X su cui si basa il modello JY-PLS, diminuisca in modo poco significativo in fase di convalida incrociata, a conferma che il modello è in grado di catturare bene la varianza della matrice anche in essenza di un campione. La varianza totale di y, invece, è piuttosto scarsa, conseguenza della difficoltà di trovare una relazione che spieghi adeguatamente per ogni apparecchiatura la varianza di y a partire da X. Tabella 4.4. Polimeri PEG e PCL, modello JY-PLS: valori di P 2 di X, ottenuti mediante convalida incrociata di tipo jackknife per le prime 5
variabili latenti, per ogni apparecchiatura. LV P 2 cum CIJMSD
JYPLS X P 2 cum CIJMSU
JYPLS X P 2 cum wawa
JYPLS X P 2 cum wwaa
JYPLS X P 2 cum 1 Td
JYPLS X P 2 cum 2 Td
JYPLS X P 2 cum 1 CIJMd
JYPLS X P 2 cum 2 CIJMd
JYPLS X 1 0.40 0.28 0.16 0.47 0.27 0.20 0.15 0.22 2 1.00 0.56 0.44 1.00 0.53 0.45 0.31 0.50 3 1.00 0.77 0.73 1.00 0.76 0.68 0.45 0.60 4 1.00 1.00 0.92 1.00 0.90 0.86 0.64 0.73 5 1.00 1.00 1.00 1.00 1.00 1.00 0.77 0.87 Tabella 4.5. Polimeri PEG e PCL, modello JY-PLS: valori di Q 2 di TOT JYPLS y (vettore unione dei prodotti delle diverse apparecchiature) ottenuti mediante convalida incrociata di tipo jackknife per le prime 5 variabili
latenti, per ogni apparecchiatura. LV Q 2 TOT
JYPLS y Q 2 cum TOT
JYPLS y 1 0.27 0.27 2 0.06 0.33 3 -0.01 0.31 4 0.02 0.34 5 0.00 0.34
Per avere un''idea più chiara della differenza in fase di convalida tra le diverse matrici, si è
calcolato l''errore relativo sulla variabile risposta per ogni apparecchiatura (Tabella 4.6). Si
nota che solo per il primo e l''ultimo set di dati si assesta intorno al 20%, per le altre matrici
l''errore è molto elevato. Anche l''errore quadratico medio in convalida incrociata (RMSECV) risulta molto elevato per quasi tutti i sistemi. Tabella 4.6. Polimeri PEG e PCL, modello JY-PLS: errore percentuale
medio ottenuto in convalida incrociata calcolato sulle variabili risposta
relative ad ogni apparecchiatura ed errore quadratico medio in convalida. Configurazione CIJM- SD CIJM- SU w-a-w-a w-w-a-a T-d1 T-d1 CIJM- d1 CIJM- d2 Errore relativo su TOT JPCL y 20.3% 35.3% 35.3% 45.5% 39.0% 47.3 % 30.3 % 22.2% RMSECV 55.8 143.7 128.6 96.3 89.0 238.1 153.6 164.0 Analisi congiunta di dati più apparecchiature 89 I risultati esposti sono particolarmente utili non solo nella comprensione del processo, ma anche per lo scopo di trasferimento di prodotto tra le diverse apparecchiature: in base agli scarsi risultati ottenuti in fase di convalida, si è optato per creare un modello per il trasferimento considerando un numero inferiore di apparecchiature, che siano tra loro più simili. 4.1.2. Modelli JY-PLS per il copolimero PCL Il modello generale JY-PLS mostra come le relazione tra le variabili di processo e la variabile risposta siano particolarmente incerte soprattutto per quanto riguarda il tipo di polimero per i diversi sistemi esaminati. Allo scopo di costruire un modello JY-PLS per il trasferimento di prodotto tra diverse apparecchiature (Capitolo 5), si restringe il campo di studio sui dati del polimero PCL, dal momento che i dati relativi a questo polimero presentano una struttura sperimentale più regolare, in cui tutte la variabili operative sono adeguatamente variate su più livelli. Inoltre i modelli PLS precedentemente costruiti sui dati di questo polimero (§ 3.2.3.1) presentavano le
migliori prestazioni in fase di convalida, e dimostravano come l''effetto di alcune variabili come la concentrazione di polimero e la portata, sia più marcato per questo tipo di polimero. 4.1.2.1. Modello generale Innanzitutto si costruisce un modello prendendo in considerazione le 4 diverse apparecchiature utilizzate per le prove con il polimero PCL ( 1 CIJMd
PCL X [348'4], 2 CIJMd
PCL X [40'4], 1 Td
PCL X [43'4] e 2 Td
PCL X [40'4]), e si impiegano 4 variabili latenti per agevolare il confronto tra i diversi miscelatori (Tabella 4.7). Tabella 4.7. Polimero PCL, modello JY-PLS: varianza spiegata e cumulata
di X per le prime 4 variabili latenti per tutte le 4 apparecchiature
considerate. LV R 2 1 CIJMd
PCL X R 2 cum 1 CIJMd
PCL X R 2 2 CIJMd
PCL X R 2 cum 2 CIJMd
PCL X R 2 1 Td
PCL X R 2 cum 1 Td
PCL X R 2 2 Td
PCL X R 2 cum 2 Td
PCL X 1 0.29 0.29 0.46 0.46 0.44 0.44 0.44 0.44 2 0.26 0.55 0.29 0.75 0.32 0.76 0.31 0.75 3 0.20 0.75 0.25 1.00 0.24 1.00 0.25 1.00 4 0.25 1.00 0.00 0.00 0.00
In questo modo si mostra come solo per l''apparecchiatura CIJM-d1 4 variabili latenti sono necessarie per descrivere la variabilità dei dati, mentre per le altre tre apparecchiature la varianza spiegata per X è pari al 100 % con 3 variabili latenti. Da questo si intuisce la presenza di 2 variabili dipendenti in questi tre modelli. La varianza spiegata per y invece 90 Capitolo4 (Tabella 4.8), è soddisfacente per tutte e 4 le apparecchiature, ma in particolare per quelle a
diametro d''ingresso maggiore (CIJM-d2 e T-d2). Tabella 4.8. Polimero PCL, modello JY-PLS: varianza spiegata e cumulata
di y per le prime 4 variabili latenti per tutte le 4 apparecchiature
considerate. LV R 2 1 CIJMd
PCL y R 2 cum 1 CIJMd
PCL y R 2 2 CIJMd
PCL y R 2 cum 2 CIJMd
PCL y R 2 1 Td
PCL y R 2 cum 1 Td
PCL y R 2 2 Td
PCL y R 2 cum 2 Td
PCL y 1 0.56 0.56 0.70 0.70 0.47 0.47 0.68 0.68 2 0.06 0.62 0.06 0.76 0.06 0.52 0.07 0.75 3 0.00 0.62 0.00 0.76 0.00 0.52 0.00 0.75 4 0.00 0.62 0.00 0.76 0.00 0.52 0.00 0.75
-1.0 -0.5 0.0 0.5 1.0 1.5 2.0 -1.0 -0.5 0.0 0.5 1.0 1.5 2.0 2.5 W/A FR C pol Type pol Size w ''R 2 pv X q ''R 2 pv y su LV 2 w''R 2 pvX q''R 2 pvy su LV1 CIJM-d1 (a) -1.0 -0.5 0.0 0.5 1.0 -1.5 -1.0 -0.5 0.0 0.5 1.0 CIJM-d2 FR C pol Size W/A Type pol w ''R 2 pv X q ''R 2 pv y su LV 2 w''R 2 pvX q''R 2 pvy su LV1 (b) -1.5 -1.0 -0.5 0.0 0.5 1.0 1.5 -3.0 -2.5 -2.0 -1.5 -1.0 -0.5 0.0 0.5 1.0 T-d1 FR C pol Size W/A Type pol w ''R 2 pv X q ''R 2 pv y su LV 2 w''R 2 pvX q''R 2 pvy su LV1 (c) -1.5 -1.0 -0.5 0.0 0.5 1.0 1.5 -1.0 -0.5 0.0 0.5 1.0 T-d2 FR C pol Size Type pol W/A w ''R 2 pv X q ''R 2 pv y su LV 2 w''R 2 pvX q''R 2 pvy su LV1 (d) Figura 4.3. Polimero PCL, modello JY-PLS: weights di tutte le variabili e loadings della
variabile risposta pesati secondo le relative varianze spiegate dalle prime due variabili
latenti, per l''apparecchiatura (a) CIJM-d1, (b) CIJM-d2, (c) T-d1 e (d) Td2. Dall''osservazione dei weights delle variabili rispetto ai loadings della variabile risposta, pesati rispetto alla varianza relativa ad ogni variabile (rispettivamente w·R 2 pvX e q·R 2 pvy di Figura 4.3), si rileva immediatamente una forte somiglianza nella posizione delle variabili di processo rispetto alla dimensione delle particelle (Size) per le due apparecchiature a Analisi congiunta di dati più apparecchiature 91 dimensione maggiore (CIJM-d2 e T-d2). Per entrambe assumono un''influenza maggiore rispetto alla dimensione delle particelle, la concentrazione (Cpol) e il tipo di polimero (Typepol), seguiti dalla portata (FR) lungo la seconda variabile latente. Dalla relativa posizione in tutti i grafici, le variabili Cpol e Typepol appaiono essere due variabili dipendenti. Infatti, dai dati si può constatare che concentrazioni polimeriche maggiori sono state studiate con un solo
tipo di polimero, mentre concentrazioni minori con l''altro, generando in questo modo la dipendenza fra queste due variabili. In Figura 4.3c, si riscontra lo stesso andamento anche per
l''apparecchiatura T-d1, mentre per il miscelatore CIJM-d1 (Figura 4.3a) è la portata ad avere una maggiore influenza sulla prima variabile latente rispetto al tipo di polimero.
Cpol FR W /A Ty pe -1.0 -0.5 0.0 0.5 1.0 1.5 2.0 C o e ff ic ie n ti C IJ M- d 1 (a) Cpol FR W /A Ty pe -1.0 -0.5 0.0 0.5 1.0 C o e ff ic ie n ti C IJ M- d 2 (b) Cpol FR W /A Ty pe -1.5 -1.0 -0.5 0.0 0.5 1.0 C o e ff ic ie n ti T -d 1 (c) Cpol FR W /A Ty pe -1.5 -1.0 -0.5 0.0 0.5 1.0 C o e ff ic ie n ti T -d 2 (d) Figura 4.4. Polimero PCL, modello JY-PLS: coefficienti (W'qj) per le diverse variabili
per le diverse apparecchiature: (a) CIJM-d1, (b) CIJM-d2, (c) T-d1 e (d) Td2. Anche dall''osservazione dei coefficienti delle variabili per le diverse apparecchiature (Figura 4.4) è chiaro come le relazioni tra le variabili di processo e la dimensione delle particelle siano molto simili, tranne che per la variabile che identifica il tipo di polimero per
l''apparecchiatura CIJM-d1. Viene riconfermato inoltre, che per tutte le apparecchiature, il rapporto W/A non presenta un''influenza significativa sulla dimensione delle particelle. 92 Capitolo4 ' appunto grazie alla presenza di relazioni analoghe tra le variabili operative e la variabile risposta, che è stato possibile ottenere buoni modelli PLS, ma è da sottolineare come il modello JY-PLS accentui la diversa importanza di ciascuna variabile nelle diverse apparecchiature, ed è importante in fase di trasferimento di prodotto utilizzare un modello
particolarmente sensibile a quest''aspetto, che non si limiti a rappresentare un andamento globale di tutti i sistemi considerati. Anche per questo modello la varianza spiegata in fase di convalida incrociata per le diverse matrici X con cui è costruito il modello (Tabelle 4.9 e 4.10) non varia molto rispetto a quella in calibrazione, ed anche la varianza complessiva per y rimane elevata. Tabella 4.9. Polimero PCL, modello JY-PLS: valori di P 2 per X ottenuti mediante convalida incrociata di tipo jackknife per tutte le 4 apparecchiature
considerate LV P 2 1 CIJMd
PCL X P 2 cum 1 CIJMd
PCL X P 2 2 CIJMd
PCL X P 2 cum 2 CIJMd
PCL X P 2 1 Td
PCL X P 2 cum 1 Td
PCL X P 2 2 Td
PCL X P 2 cum 2 Td
PCL X 1 0.29 0.29 0.45 0.45 0.41 0.41 0.41 0.41 2 0.26 0.55 0.29 0.74 0.32 0.73 0.32 0.73 3 0.20 0.75 0.20 0.94 0.27 1.00 0.27 1.00 4 0.25 1.00 0.06 1.00 0.00 1.00 0.00 1.00 Tabella 4.10. Polimero PCL, modello JY-PLS: valori di Q 2 per TOT PCL y (vettore unione dei prodotti delle diverse apparecchiature) ottenuti mediante
convalida incrociata di tipo jackknife per tutte le 4 apparecchiature
considerate. LV Q 2 TOT PCL y Q 2 cum TOT
PCL y 1 0.55 0.55 2 0.07 0.62 3 0.01 0.63 4 0.00 0.63 Tabella 4.11. Polimero PCL, modello JY-PLS: errore percentuale medio
ottenuto in convalida incrociata calcolato sulle variabili risposta relative ad
ogni apparecchiatura ed errore quadratico medio in convalida. Configurazione Errore relativo su y RMSECV CIJM-d1 21.8 % 92.9 CIJM-d2 9.9 % 47.8 T-d1 23.3 % 82.4 T-d2 15.3 % 80.6 Va sottolineata in modo particolare la bassa percentuale d''errore in fase di convalida incrociata (Tabella 4.11): per tutte le apparecchiature si assesta su valori accettabili, e in modo Analisi congiunta di dati più apparecchiature 93 particolare per l''apparecchiatura CIJM-d2 è inferiore al 10%. Anche il valore dell''errore quadratico medio è molto inferiore rispetto al modello JY-PLS generale per tutti i 4 sistemi. Questi risultati confermano le aspettative sulla capacità di predizione di questo modello e
sulla necessità di concentrare l''analisi su un particolare set di dati, almeno in una prima fase di studio. 4.1.2.2. Modello per le apparecchiature CIJM-d1 e CIJM-d2 Si è visto come la tecnica JY-PLS sia uno strumento molto utile per mantenere indipendente
l''informazione data da diverse apparecchiature, in relazione ad una risposta comune. In base ai risultati ottenuti nei modelli JY-PLS presentati, è stato scelto di effettuare delle prove di trasferimento di prodotto 1 (presentate nel Capitolo 5) tra due apparecchiature della stessa configurazione ma a diversa scala, in particolare per la configurazione CIJM-d1 e CIJM-d2. Infatti i risultati rispetto a queste due apparecchiature, si sono dimostrati particolarmente buoni in fase di convalida incrociata per il modello JY-PLS basato sulle 4 apparecchiature del database del polimero PCL. Dato il miglioramento dei risultati ottenuti restringendo il campo di studio, si è voluto verificare se limitando il modello a queste due sole apparecchiature, i risultati in termini di relazioni tra variabili ed errori del modello in convalida incrociata venissero modificati ulteriormente. Si è costruito a tal scopo un modello JY-PLS in cui si considerano i dati per il polimero PCL delle apparecchiature 1 CIJMd
PCL X [348'4] e 2 CIJMd
PCL X [40'4]. Si è visto come sia importante mantenere separata l''informazione data dalle due apparecchiature, che seppur mostrando comportamenti molto simili, presentano alcune differenze che devono essere considerate in fase di trasferimento. La varianza spiegata per X e y non è riportata, in quanto del tutto simile a quella del modello JY-PLS su tutte e 4 le apparecchiature (Tabelle 4.7 e 4.8). Anche per quanto riguarda i weights delle variabili di processo rispetto ai loadings della variabile risposta (Figura 4.5), si riscontra una forte somiglianza con quelli del modello precedente: in questo caso però è maggiore la correlazione tra la concentrazione di polimero e la dimensione delle particelle. Come nel modello precedente, si osserva come la variabile che rappresenta la portata agli ingressi abbia una maggiore influenza per il miscelatore CIJM-d1, a scapito della variabile che influenza il tipo di polimero, rilevante solo sulla seconda variabile latente. Al contrario,
per l''apparecchiatura CIJM-d2 il tipo di polimero è rilevante sulla prima variabile latente, ma questo è dovuto alla dipendenza riscontrata con la variabile Cpol, che per entrambe le apparecchiature risulta avere una forte influenza sulla dimensione delle particelle.
1 Per trasferimento di prodotto si intende il passaggio di produzione di un certo prodotto da un''apparecchiatura ad un''altra, in
generale di diversa dimensione o configurazione, mantenendo le caratteristiche desiderate del prodotto. 94 Capitolo4
-0.5 0.0 0.5 1.0 -1.0 -0.5 0.0 0.5 1.0 1.5 2.0 FR C pol W/A Size Type pol w ''R 2 pv X q ''R 2 pv y su LV 2 w''R 2 pvX q''R 2 pvy su LV1 CIJM-d1 (a) -1.0 -0.5 0.0 0.5 1.0 -1.5 -1.0 -0.5 0.0 0.5 CIJM-d2 FR Size W/A C pol Type pol w ''R 2 pv X q ''R 2 pv y su LV 2 w''R 2 pvX q''R 2 pvy su LV1 (b) Figura 4.5. Polimero PCL, modello JY-PLS: weights di tutte le variabili e loadings della
variabile risposta pesati secondo le relative varianze spiegate dalle prime due variabili
latenti, per (a) CIJM-d1e (b) CIJM-d2. I coefficienti delle variabili di processo presentano qualche minima differenza in termini di importanza relativa, a causa della restrizione del set di dati anche se la relazione con la dimensione delle particelle è la stessa.
Cp ol FR W /A Ty pe -2.0 -1.5 -1.0 -0.5 0.0 0.5 1.0 1.5 2.0 C o e ff ic ie n ti C IJ M- d 1 (a) Cp ol FR W /A Ty pe -2.0 -1.5 -1.0 -0.5 0.0 0.5 1.0 1.5 2.0 C o e ff ic ie n ti C IJ M- d 2 (b) Figura 4.6. Polimero PCL, modello JY-PLS: coefficienti (W*qj) per le diverse variabili
per: (a) CIJM-d1e (b) CIJM-d2. Le considerazioni riguardo ai pesi delle variabili e ai relativi coefficienti, possono esser quindi riassunte come:
' per la configurazione CIJM-d1, si possono ottenere particelle di piccola dimensione agendo soprattutto sulla concentrazione di polimero, che va diminuita, mentre va mantenuta alta la portata agli ingressi (anticorrelazione tra le due variabili in questione su LV1 in figura 4.5a); ' per la configurazione CIJM-d2, per ottenere piccole particelle, è più importante la scelta del polimero da utilizzare, e in particolare è preferibile il PCL80 a basse concentrazioni. La portata ha un ruolo secondario in questo caso, e va comunque mantenuta alta (leggera anticorrelazione tra le due variabili in Figura 4.5b). Analisi congiunta di dati più apparecchiature 95 -0.2 0.0 0.2 -0.2 -0.1 0.0 0.1 0.2 CIJM-d1
CIJM-d2 S cor es su LV 2 Scores su LV1 Figura 4.7. Polimero PCL, modello JY-PLS: scores dei campioni di CIJM-d1 e CIJM-d2. I
due raggruppamenti individuano campioni ottenuti con lo stesso polimero. ' interessante analizzare anche la posizione degli scores sul piano individuato dalle prime due variabili latenti, che catturano per entrambe le matrici più del 50% della varianza spiegata totale. Si nota da Figura 4.7 come i campioni si dispongano in 4 diversi gruppi: due gruppi per ciascuna apparecchiatura, rappresentata da un diverso simbolo ('' per CIJM-d1 e ' per CIJM-d2). Questa suddivisione tra i campioni della stessa apparecchiatura, indicata da due ellissi tratteggiate nel diagramma, è dovuta al diverso polimero utilizzato: i campioni
raggruppati dall''ellisse in alto a sinistra, in corrispondenza della variabile Type pol, sono ottenuti con il polimero PCL80, mentre quelli raggruppati in basso a destra sono ottenuti con PCL14. Dal confronto degli scores con il grafico dei weights in Figura 4.5, si deduce che i campioni del secondo gruppo in generale presentano una maggiore dimensione delle particelle (si trovano infatti in corrispondenza della variabile risposta Size) e che si dispongono lungo la seconda variabile latente in funzione della portata con cui sono ottenuti. I
campioni che presentano portata d''ingresso maggiori si dispongono infatti sulla parte inferiore del piano, in corrispondenza della variabile FR e in opposizione alla variabile Size,
mentre quelli che presentano portata d''ingresso minore giacciono sulla parte superiore del diagramma. Tabella 4.11. Polimero PCL, modello JY-PLS: errore percentuale medio
ottenuto in convalida incrociata calcolato sulle variabili risposta relative ad
ogni apparecchiatura ed errore quadratico medio in convalida. Configurazione Errore relativo su y RMSECV CIJM-d1 21.8% 93.2 CIJM-d2 10.8% 49.4
Per quanto riguarda la varianza in fase di convalida incrociata, è anch''essa simile al caso
precedente, per cui non viene riportata. L''errore percentuale per l''apparecchiatura CIJM-d2 e
l''errore quadratico medio in convalida incrociata sono di poco superiori in entrambi i sistemi 96 Capitolo4
rispetto al modello sulle 4 apparecchiature, mentre l''errore percentuale per CIJM-d1 resta costante (Tabella 4.11). Questo dimostra che da questo punto di vista i due modelli sono equivalenti. In base a questi risultati non sembra che limitare il modello JY-PLS alle due sole
apparecchiature d''interesse porti dei miglioramenti significativi. In ogni caso questo tipo di procedura può essere utilizzata anche per l''analisi delle combinazioni di altre apparecchiature. 4.1.2.3. Inserimento di interazioni tra le variabili del modello Nel tentativo di migliorare il modello presentato al paragrafo 4.1.2.2, si sono introdotte delle nuove variabili, date dalla combinazione di quelle già esistenti. Questo era già stato effettuato in modelli PLS precedenti (§3.3.3), e aveva mostrato buoni risultati in fase di convalida. Si è scelto di riportare solo il modello in cui si inseriscono nelle matrici di 1 CIJMd
PCL X e 2 CIJMd
PCL X le variabili ottenute come prodotto di tre variabili originarie, ottenendo le matrici fatt 1,3 CIJMd PCL X e fatt 2,3 CIJMd
PCL X . Tabella 4.12. Polimero PCL, modello JY-PLS con ulteriori variabili ottenute
come prodotto a 2 o 3 fattori di quelle già presenti: varianza spiegata e
cumulata di y per le prime 4 variabili per le apparecchiature CIJM-d1 e
CIJM-d2 per il polimero PCL. LV R 2 fatt CIJMd JYPLS 3 , 1 y R 2 cum fatt CIJMd JYPLS 3 , 1 y R 2 fatt CIJMd JYPLS 3 , 2 y R 2 cum fatt CIJMd JYPLS 3 , 2 y 1 0.50 0.50 0.52 0.52 2 0.14 0.64 0.22 0.75 3 0.03 0.66 0.04 0.79 4 0.02 0.68 0.02 0.81 Tabella 4.13. Polimero PCL, modello JY-PLS con ulteriori variabili ottenute
come prodotto a 3 fattori di quelle già presenti: errore relativo medio in
convalida incrociata. Configurazione Errore relativo su y CIJM-d1 19.0% CIJM-d2 9.3% La varianza spiegata per fatt d CIJMd JYPLS 3 , 2 1 y , vettore unione delle variabili risposta delle due matrici, (Tabella 4.12) migliora rispetto al modello precedente, e si rilevano alcuni miglioramenti
anche in fase di convalida (Tabella 4.13). Questa può essere un''alternativa interessante da considerare in fase di trasferimento di prodotto, per includere possibili non linearità nelle relazioni tra la variabile risposta e le variabili di processo. Analisi congiunta di dati più apparecchiature 97 4.1.3.Conclusioni In questo Capitolo sono stati verificati i vantaggi nell''applicazione della tecnica JY-PLS ai dati del processo di produzione di nanoparticelle. Dal modello costruito su tutti i dati storici disponibili, si è infatti ricavato che:
' si è in grado di rilevare le stesse relazioni tra le variabili manipolabili e la variabile risposta che si sono ottenute con l''impiego di diversi modelli PCA e PLS. ' Si sono rilevate alcune differenze fra le diverse apparecchiature: le variabili maggiormente influenti sulla dimensione delle particelle si presentano diverse nelle varie apparecchiature, e in particolare per il miscelatore CIJM-SU, le relazioni non sembrano seguire l''andamento rilevato per le altre apparecchiature. Oltre ad approfondire la comprensione del processo, si è voluto ricercare un modello efficiente nella predizione della dimensione delle particelle, che possa essere utilizzato come modello di riferimento per il trasferimento di prodotto. Pertanto si è ristretto il campo di studio, ai soli dati del polimero PCL, rilevando che:
' il modello costruito sui tutti dati del polimero PCL, in cui si considerano 4 apparecchiature, si dimostra in grado di predire efficacemente la variabile risposta: si ha un errore in predizione dal 9% al 23% circa, ovvero per tute le apparecchiature tale errore è inferiore a quello accettato dagli sperimentatori. Inoltre la varianza spiegata sia per X che per y è alta per tutti i sistemi a partire dalla seconda variabile latente. ' Restringendo ulteriormente il modello alle due sole apparecchiature della configurazione a getti collidenti confinati (CIJM) nelle due dimensioni del diametro d''ingresso, non si rilevano miglioramenti significativi nella capacità di predizione del modello. Capitolo 5 Trasferimento di prodotto tra apparecchiature diverse In questo Capitolo, tutte le informazioni ottenute grazie alla costruzione dei vari modelli PLS e JY-PLS nei precedenti capitoli, vengono sfruttate per effettuare il trasferimento di prodotto
tra l''apparecchiatura CIJM-d1 e quella CIJM-d2, per il polimero PCL, utilizzando le tecniche di inversione di modelli descritte al Capitolo 2. 5.1. Trasferimento di prodotto: inversione del modello JY-PLS In questo studio, lo scopo del trasferimento di prodotto è di determinare il set di variabili di processo (xnew) per l''apparecchiatura CIJM-d2, per ottenere in uscita nanoparticelle di diametro predefinito (ydes), che sono già state ottenute in un''apparecchiatura diversa (CIJM- d1). Per fare questo, dati di esperimenti condotti nelle apparecchiature CIJM-d1 e CIJM-d2 sono stati correlati tramite un modello di tipo JY-PLS (§4.1.2.2). Procedure di inversione di modello, sono quindi applicate per ottenere le condizioni operative di CIJM-d2 che assicurino la produzione di nanoparticelle di diametro desiderato. Figura 5.1. Rappresentazione grafica dell''inversione del modello JY-PLS costruito sui dati
dell''apparecchiatura CIJM-d2 e CIJM-d1 per determinare le condizioni operative per
l''apparecchiatura CIJM-d1, assumendo come riferimento un campione già a disposizione
nel set di dati. 100 Capitolo 5 Dal momento che il successo dell''inversione dipende dalla bontà del modello di partenza e dal tipo di vincoli del problema, che determina il problema di ottimizzazione che deve esser risolto per effettuare l''inversione del modello (§2.2.2), in una prima fase la procedura di inversione del modello JY-PLS è stata testata assumendo di voler determinare le condizioni
operative per l''apparecchiatura CIJM-d1, assumendo come riferimento un campione già a disposizione nel set di dati. Graficamente tale metodo è riportato in Figura 5.1. La sensitività della procedura è stata studiata al variare del numero di variabili latenti considerate per la costruzione del modello e al variare del numero di campioni utilizzati. 5.1.1.Effetto del numero di variabili latenti Il campione selezionato come riferimento per l''inversione per l''apparecchiatura CIJM-d1 è stato scelto in modo che la dimensione delle nanoparticelle ottenute appartenesse ad un intorno della media del relativo set di dati ( 1 d CIJM-
PCL y ) e che presentasse un errore quadratico di predizione (SPEy) tra i più bassi. In questo modo si assicura che il campione scelto giaccia in prossimità del piano del modello individuato dalle variabili latenti, e si limitano le incertezze
nell''inversione dovute alla differenza tra il valore reale e quello predetto dal modello. In Tabella 5.1 sono riportati i valori delle variabili operative e delle dimensioni delle particelle ottenute per il campione in esame: Tabella 5.1. Valori del set di variabili del campione di PCL ottenuto con
l''apparecchiatura CIJM-d1 scelto per testare la procedura di inversione. Dimensione particella [nm] Concentrazione di polimero [mg/mL] Portata [mL/min] Rapporto acqua/solvente [-] Tipo di polimero [-] 265.8 2.65 40 6.08 PCL14 ' stata quindi valutata la sensitività dei risultati dell''inversione al numero di variabili latenti scelte nella costruzione del modello JY-PLS. Una volta estratto dal set di dati tale campione, è stato pertanto ricostruito il modello JY-PLS tra le apparecchiature della configurazione CIJM- d1 e CIJM-d2. In base a questo modello, le cui caratteristiche sono simili a quelle del modello
presentato nel Capitolo 4 (§4.1.2.2), è stata effettuata l''inversione, assumendo come valore desiderato per il diametro delle nanoparticelle (ydes) quello del campione di riferimento estratto dal dataset. In questo caso l''inversione del modello è stata effettuata risolvendo il problema di ottimizzazione relativo allo scenario 2, presentato al Capitolo 2 (§2.2.2.2), in cui i valori ydes sono determinati e sono imposti vincoli di uguaglianza o disuguaglianza per xnew. In questo caso gli unici vincoli imposti sulle variabili manipolabili sono di tipo fisico/sperimentale: i limiti inferiori infatti sono di tipo fisico (le variabili non devono assumere valori negativi), mentre quelli superiori sono imposti in base ai valori accessibili sperimentalmente: Trasferimento di prodotto tra apparecchiature diverse 101 ' 0 ' C pol '15 [mg/mL]; ' 0 ' FR ' 120 [mL/min];
' 0 ' W/A' 8 [-];
' 0 ' Type pol ' 1 [-]. In base alla varianza spiegata per X (§4.1.2.2), si è scelto di valutare i risultati dell''inversione costruendo il modello JY-PLS con un numero di variabili latenti da 2 a 4. I risultati sono riportati in Tabella 5.2, in termini di variabili operative calcolate e reali (rispettivamente xnew, xreal) e delle dimensioni delle particelle desiderate (ydes) e calcolate (ynew). In ognuno dei casi presentati, si considera sempre un numero di variabili latenti di X superiore a quello strettamente necessario per y: infatti essendo la variabile risposta univariata, necessiterebbe di una sola variabile latente. Questa differenza fra i due spazi latenti, porta alla generazione di uno spazio nullo (§2.2.2.4). Nel caso in esame, il campione scelto presenta delle caratteristiche prossime alla media del dataset completo, quindi all''interno del range dei dati usati per costruire il modello. Di conseguenza non è indispensabile sfruttare la presenza dello spazio nullo (come indicato al §2.2.2.4) per trovare una soluzione che rispetti le condizioni di processo dei dati storici. Tabella 5.2. Inversione del modello JY-PLS per determinare le condizioni di
processo di un campione dell''apparecchiatura CIJM-d1, al variare del
numero di variabili latenti: confronto tra i parametri reali e quelli stimati. LV Cpol FR W/A Typepol y xreal yreal Valori reali 2.65 40 6.08 0 265.8 xnew ynew Valori calcolati 4LV 2.55 69.23 3.05 0.59 265.8 3LV 2.55 69.24 3.04 0.59 265.8 2LV 2.55 69.24 3.04 0.59 265.8 Da Tabella 5.2 si osserva come con 2 o 3 variabili latenti in questo caso non vi siano rilevanti modifiche nei risultati: i valori sono abbastanza prossimi a quelli reali, lo scostamento maggiore è dato dal valore della variabile W/A (questa variabile è spiegata soprattutto dalla quarta componente) e dalla variabile che identifica il tipo di polimero (Typepol). Quest''ultima variabile è di tipo binario, assume valore 1 per il polimero PCL80 e valore 0 per il polimero PCL14. Essa però assume un valore intermedio perché come detto, il campione scelto presenta delle caratteristiche prossime alla media, perciò il modello tende a restituire valori intermedi anche delle variabili stimate. 102 Capitolo 5 Inoltre si nota che il valore di ydes coincide perfettamente con quello di ynew in tutti e tre i casi in esame. Infatti nonostante le differenze tra xnew e xreal le proiezioni di entrambi i set si trovano all''interno dello spazio nullo. Lo scostamento tra i valori reali e calcolati della variabile Typepol è comprensibile dall''esame del diagramma degli scores sulle prime 2 LV, riportato per il caso di inversione del modello
costruito con 3 variabili latenti (Figura 5.2a): le proiezioni della soluzione dell''inversione t new giacciono in mezzo ai due cluster che identificano appunto il tipo di polimero (§4.1.2.2). Nelle future prove di inversione potrebbe quindi essere opportuno imporre un vincolo di uguaglianza su questa variabile. -0.2 0.0 0.2 -0.2 -0.1 0.0 0.1 0.2 CIJM-d1
CIJM-d2
t new t real S cor es su LV 2 Scores su LV1 (a) -0.2 0.0 0.2 -0.2 -0.1 0.0 0.1 0.2 CIJM-d1
CIJM-d2
t new t real S cor es su LV 2 Scores su LV1 (b) Figura 5.2. Inversione del modello JY-PLS con 3 VL per determinare le condizioni di
processo di un campione dell''apparecchiatura CIJM-d1: scores per l''apparecchiatura
CIJM-d1 e CIJM-d2 e scores reali e determinati con l''inversione, del campione estratto,
(a) senza e (b) dopo aver fissato il tipo di polimero. Con l''utilizzo di 4 LV invece, pari al numero delle variabili reali, la varianza spiegata per la matrice X è circa il 100%, per cui si ricade nel caso di una regressione multivariata ordinaria. Per questo è necessario rimuovere dalla formulazione del problema di inversione (scenario 2) la statistica new x SPE (§2.2.2.2). Come si nota i risultati sono ancora una volta simili alle prove effettuate su modelli costruiti con un numero di variabili latenti minore, dal momento che, se i vincoli imposti su xnew non sono in realtà attivi nell''ottimizzazione (perché come in questo
caso la funzione obiettivo presenta un minimo all''interno del dominio), il problema si riduce
ad un''inversione diretta (§2.2.2.1). Queste stesse tre prove sono state eseguite imponendo un vincolo sul tipo di polimero, il PCL14, per verificare sia se i valori delle variabili operative predetti si avvicinano maggiormente ai valori reali, sia se imponendo questo tipo di vincolo, vi siano modifiche nei risultati al variare delle variabili latenti utilizzate. I risultati sono riportati analogamente al caso precedente in Tabella 5.3. Trasferimento di prodotto tra apparecchiature diverse 103 Si osserva che con l''utilizzo di 3 o 4 variabili latenti il valore della portata è maggiormente prossimo a quello del campione reale, rispetto al caso precedente, mentre la stima della concentrazione di polimero risulta essere meno precisa, ma ancora accettabile. Il valore del rapporto W/A rimane invece lontano da quello reale anche con 4 variabili latenti, probabilmente perché questa variabile non influenza particolarmente la dimensione delle particelle, come dimostrato dagli studi precedenti. Anche i valori degli scores sono più vicini a quelli reali rispetto al caso in cui non è imposto il tipo di polimero (Figura 5.2b). Con 2 sole
variabili latenti invece, i risultati dell''inversione peggiorano in modo significativo sia rispetto
al caso precedente, sia rispetto all''utilizzo di più variabili latenti: queste 2 variabili infatti non sono sufficienti a catturare una buona percentuale di varianza spiegata per le 3 variabili principali (Cpol, FR e Typepol), la cui variabilità è catturata in buona parte anche dalla terza variabile latente (§ 4.1.2.2). Tabella 5.3. Inversione del modello JY-PLS per determinare le condizioni di
processo di un campione dell''apparecchiatura CIJM-d1, al variare del
numero di variabili latenti: confronto tra i parametri reali e quelli stimati nel
caso in cui è stato fissato il tipo di polimero. Cpol FR W/A Typepol y xreal yreal Valori reali 2.65 40 6.08 0 265.8 xnew ynew Valori calcolati 4LV 2.39 43.61 3.12 0 292.6 3LV 2.39 43.79 2.88 0 292.6 2LV 7.12 76.88 2.99 0 298.1 Diversamente dal caso precedente, in queste prove si nota che non vi è coincidenza fra i valori di ydes e ynew, e questo dimostra che non è possibile trovare una soluzione dall''inversione del modello, che giaccia lungo spazio nullo (in cui è garantito il valore desiderato della variabile risposta) e contemporaneamente rispetti il vincolo imposto. La soluzione trovata è pertanto un compromesso tra questi due vincoli. Inoltre, nel primo caso non si è osservata alcuna variazione dei risultati al variare del numero di variabili latenti poiché come anticipato, il risultato calcolato senza imporre alcun vincolo sugli elementi di xnew, equivale a quello di un''inversione diretta, in cui la soluzione è unica.
Al contrario, nel caso in cui si vincolino alcune variabili, la soluzione dell''ottimizzazione dipende dal numero di variabili latenti. Infatti, affinché la soluzione risulti accettabile, è necessario che le variabili latenti considerate catturino in modo adeguato la varianza delle 104 Capitolo 5 variabili vincolate. Nel caso in esame, sono necessarie almeno 3 variabili latenti per catturare sufficientemente la varianza della variabile Typepol su cui è imposto il vincolo.
Dall''osservazione sul diagramma degli scores di Figura 5.2b, in cui vengono riportati gli scores dei campioni in esame sia dell''apparecchiatura CIJM-d1 ('') che CIJM-d2 ( ) e gli scores reali (') e predetti (') del campione scelto per queste prove, si ha la verifica grafica di quanto i risultati si avvicinino a quelli reali nel caso in cui si imponga il tipo di polimero. 5.1.2.Effetto del numero di campioni considerati Si procede quindi ad analizzare la sensitività della soluzione ottenuta dall''inversione del modello al numero di campioni del set di dati con cui si costruisce il modello stesso. Tali campioni sono estratti in numero crescente secondo due procedure: una di selezione random (dal 10 % al 80 % dei campioni totali) e una che estrae i campioni secondo un criterio di d- ottimalità, secondo il quale si seleziona dalla matrice totale un certo numero di campioni (dal 10% al 90 % dei campioni totali) in modo che il contenuto informativo dei dati selezionati (rappresentato dal determinante della matrice di varianza-covarianza) sia massimizzato (de Aguiar et al., 1995). 5.1.2.1. Estrazione di campioni in modo random Per quanto riguarda il primo caso (estrazione random di una percentuale crescente di
campioni), il campione su cui si effettua l''inversione è lo stesso delle precedenti prove (Tabella 5.1), ma il modello utilizzato è ricalcolato di volta in volta in base alla matrice ottenuta dalla selezione dei campioni. Le prove vengono effettuate tenendo conto di 3 variabili latenti e della stessa strategia di inversione utilizzata precedentemente (scenario 2, §2.2.2.2) imponendo gli stessi vincoli fisici riportati al §5.1.1. Ogni prova di inversione per una determinata percentuale di campioni trattenuti, è effettuata più volte (circa una decina), per evitare che i risultati risultino troppo dipendenti dal tipo di campioni scelti di volta in volta, e i valori riportati sono relativi alla media dei valori ottenuti da queste prove. Vengono in seguito riportati in Figura 5.3, i risultati ottenuti al variare del numero di campioni selezionati, in termini di errore relativo tra i vettori xnew e xreal, rispetto ad ogni variabile di processo. ' interessante osservare in Figura 5.3 come vari l''errore relativo rispetto ad ogni variabile della soluzione (xnew,i) al variare del numero di campioni della matrice utilizzata per costruire il modello. In questo caso il tipo di polimero è stato imposto a priori, quindi l''errore è nullo per questa variabile. Si nota che considerando dal 90% al 70% dei campioni, gli errori sulla variabile portata e sul rapporto W/A sono all''incirca costanti, mentre aumentano per la concentrazione di polimero. Da questa percentuale in poi vi è un andamento oscillante, indice Trasferimento di prodotto tra apparecchiature diverse 105 di una maggiore sensibilità del modello al tipo di campioni presenti, ed in generale la percentuale degli errori aumenta per tutte le variabili. Infine si sono calcolati i valori dell''errore quadratico in predizione per le varie prove, che si
assesta a valori molto prossimi a zero (nell''ordine di 10-8), come diretta conseguenza
dell''utilizzo del problema di minimizzazione relativo allo scenario 2, in cui new x SPE compare nella funzione obiettivo. 20% 30% 40% 50% 60% 70% 80% 90% 0.0 0.2 0.4 0.6 0.8 1.0 Er ro re r e la ti v o Percentuale di campioni selezionati C pol FR
W/A
Type pol Figura 5.3. Analisi al variare del numero di campioni considerati: errore relativo per ogni
variabile di processo a percentuali diverse di campioni eliminati in modo random. 5.1.2.2. Estrazione di campioni con procedura d-ottimale In questo caso i campioni considerati vengono estratti secondo una procedura d-ottimale. In questo modo la matrice che risulta dalla selezione, della percentuale fissata di campioni, contiene i campioni che massimizzano il determinante della matrice di varianza-covarianza. Il campione selezionato per la convalida è lo stesso dei casi precedenti (Tabella 5.1) e sono stati imposti i vincoli sul vettore soluzione di tipo fisico-sperimentale riportati al §5.1.1. La procedura di inversione del modello utilizzata è quella relativa allo scenario 2 (§2.2.2.2) ed è stato imposto come nelle prove precedenti, il vincolo sul tipo di polimero. In questo caso le percentuali di campioni selezionati per la costruzione del modello si estendono dal 10% al 90% e i risultati sono riportati in Figura 5.4.
L''errore relativo alla variabile Type pol è nullo, in quanto come precisato, questa variabile è imposta a priori, ma anche l''errore rispetto a W/A si dimostra particolarmente basso (Figura 5.4). Gli errori per le altre variabili invece, si assestano su valori elevati e diminuiscono
all''aumentare del numero di campioni considerati per la costruzione del modello. ' da sottolineare comunque, che con questa procedura non vengono selezionati campioni che
si trovano nell''intorno del campione di cui si stimano le condizioni iniziali, se non selezionando almeno il 90% dei campioni: questo riduce in parte la capacità di stimare una soluzione vicina ai valori reali, dal momento che lo spazio dei dati selezionati è meno risolto in prossimità del campione di interesse. 106 Capitolo 5 10%20%30%40%50%60%70%80%90% 0 1 2 3 4 5 Er ro re r e la ti v o Percentuale di campioni selezionati C pol FR
W/A
Type pol Figura 5.4. Analisi al variare del numero di campioni considerati: errore relativo per ogni
variabile di processo a percentuali diverse di campioni selezionati con procedura d-
ottimale. Da queste prove si può concludere che è importante la scelta del set di dati su cui costruire il modello, e che se si avessero a disposizione il 20-30% di campioni in meno, i risultati non cambierebbero in modo rilevante, dimostrando che il modello sotto questo punto di vista è abbastanza robusto. Oltre tale soglia, le differenze tra le soluzioni trovate diventano più
significative poiché viene persa parte dell''informazione che viene portata dall''insieme di tutti i campioni delle due apparecchiature. 5.2. Trasferimento di prodotto dall''apparecchiatura CIJM-d1 a CIJM-
d2
Si vogliono utilizzare le procedure per l''inversione di modello proposte nel Capitolo 2 (§2.2.2), per ottenere un set di variabili operative per l''apparecchiatura CIJM-d2, al fine di ottenere nanoparticelle di dimensione desiderata. Figura 5.5. Rappresentazione grafica dell''inversione del modello JY-PLS costruito sui dati
dell''apparecchiatura CIJM-d2 e CIJM-d1 al fine di determinare le condizioni operative
per l''apparecchiatura CIJM-d2, per ottenere un campione prodotto con CIJM-d1. Trasferimento di prodotto tra apparecchiature diverse 107 In un primo caso (Figura 5.5) questa coincide con un campione già ottenuto in CIJM-d1 (ydes = 335.1 nm), mentre in un secondo caso l''obiettivo è quello di ottenere nanoparticelle con diametro inferiore ad un certo valore (ydes ' 200 nm), di particolare interesse per
l''applicazione pratica delle nanoparticelle.
In entrambi i casi l''inversione è effettuata considerando il modello JY-PLS costruito sui dati di queste due apparecchiature. 5.2.1.Trasferimento per ottenere particelle di diametro desiderato 5.2.1.1. Caso 1: scenario 2 in assenza del vincolo sul tipo di polimero
Per verificare l''efficacia delle tecniche proposte per il trasferimento di prodotto da CIJM-d1 a CIJM-d2, si è scelto nel primo caso come valore desiderato in uscita (ydes) un valore di diametro medio delle particelle che fosse stato ottenuto in entrambe le apparecchiature in esame, e che avesse un valore SPEy piuttosto basso. Il campione di CIJM-d2 corrispondente è stato pertanto eliminato dal set di dati di questa apparecchiatura e un modello JY-PLS è stato costruito sui dataset disponibili per le due apparecchiature in questione (rispettivamente di dimensione [340'1] e [39'1]). I valori della variabili per il campione scelto, per entrambe le apparecchiature, sono riportate in Tabella 5.4. Tabella 5.4. Valori del set di variabili del campione scelto per le prove di
inversione su CIJM-d2. Apparecchiatura Dimensione particella [nm] Concentrazione di polimero [mg/mL] Portata [mL/min] Rapporto acqua/solvente [-] Tipo di polimero [-] CIJM-d1 335.1 0.22 20 6.08 PCL80 CIJM-d2 335.1 1.47 3 1 PCL80 Per la costruzione del modello sono state scelte 2 variabili latenti dal momento che per un numero superiore, la varianza spiegata per 2 CIJMd PCL X è pari al 100% della varianza totale a causa della collinearità tra 2 variabili (la concentrazione e il tipo di polimero) indotta dalla tipologia di esperimenti effettuati. Si sono osservate le varianze spiegate per le singole variabili considerando questo numero di variabili latenti (Tabella 5.5). I valori riportati si dimostrano molto elevati eccetto che per il rapporto W/A, la cui varianza spiegata è solo del 4%. Dalle precedenti analisi (§4.1.2) si è comunque accertato che tale variabile non influenza in modo particolare la dimensione delle particelle, per cui la scelta effettuata per il numero di variabili latenti risulta del tutto accettabile. 108 Capitolo 5 Tabella 5.5. Polimero PCL, modello JY-PLS: varianza spiegata per ogni
variabile di processo dalle prime due variabili latenti per l''apparecchiatura
CIJM-d2. CIJM-d2 LV R 2 C pol R 2 FR R 2 W/A R 2 Type pol 1 0.83 0.19 0.00 0.83 2 0.17 0.78 0.04 0.17 La prima inversione viene effettuata basandosi sul problema di ottimizzazione relativo allo scenario 2 testato precedentemente. In una prima prova, non è stato vincolato il tipo di polimero e i pesi utilizzati nella funzione obiettivo sono quelli proposti nel Capitolo 2 (§2.2.2.2). Gli unici vincoli imposti sulle variabili, sono i vincoli fisici, che rimangono quelli utilizzati precedentemente (§5.1.1). Sotto queste condizioni, il risultato dell''inversione
effettuata è equivalente a quello di un''inversione diretta (§2.2.2.1), dal momento che non ci sono vincoli attivi e il valore di new x SPE ottenuto è estremamente basso. In altre parole, la soluzione appartiene al piano individuato dalle 2 variabili latenti e allo spazio nullo, infatti vi è coincidenza tra i valori di ydes e yreal. Tabella 5.6. Inversione del modello JY-PLS per determinare le condizioni di
processo di un campione dell''apparecchiatura CIJM-d2, tramite lo scenario
2: confronto tra i parametri reali e quelli stimati. Cpol FR W/A Typepol y xreal yreal Valori reali 1.47 3 1 1 335.1 xnew ynew Valori calcolati 3.42 59.34 3.54 0.455 335.1 Il valori stimati delle variabili di processo (Tabella 5.6), sono ragionevoli dal punto di vista
fisico: la dimensione delle particelle da ottenere è un valore all''incirca medio rispetto al completo set di dati, di conseguenza i valori predetti, che si assestano anch''essi all''incirca intorno alla media, sono plausibili per ottenere particelle di tale dimensione, anche se le variabili operative calcolate non coincidono con i valori reali del campione estratto, soprattutto per quanto riguarda la portata. Si è valutato infine che il valore di T 2 è molto basso (8·10-3) e inferiore al limite (6.1), come l'' new x SPE (prossimo a zero rispetto al limite 2.4·10 -2): questo come anticipato, è dovuto al fatto che la soluzione trovata appartiene al piano individuato da LV1 e LV2, in posizione centrale rispetto al set di dati completo. Trasferimento di prodotto tra apparecchiature diverse 109 -0.2 0.0 0.2 -0.2 -0.1 0.0 0.1 0.2 CIJM-d1
CIJM-d2
t new t real S cor es su LV 2 Scores su LV1 Figura 5.6. Inversione del modello JY-PLS con 2 VL per determinare le condizioni di
processo di un campione dell''apparecchiatura CIJM-d2: scores per l''apparecchiatura
CIJM-d1 e CIJM-d2 e scores del campione estratto reali e calcolati dall''inversione, senza
aver fissato il tipo di polimero. Viene quindi riportato il diagramma degli scores sul piano delle due variabili latenti considerate (Figura 5.6), in cui si evidenziano tra i campioni appartenenti all''apparecchiatura CIJM-d1 ('') che CIJM-d2 ( ) e le posizioni degli scores reali (') e stimati (') del campione in esame. Si osserva che i nuovi scores predetti (tnew) si allontanano da quelli reali (treal), ma in ogni caso, la differenza tra il valore reale e il valore stimato degli scores del campione (treal e tnew) è maggiore per la seconda variabile latente rispetto alla prima: quest''ultima infatti cattura la percentuale maggiore di varianza delle variabili Cpol e Typepol che sono la variabili meglio stimate dal modello. Dal grafico viene evidenziato come i tnew stimati si trovino in posizione centrale nel piano degli scores, traslati in modo significativo rispetto a quelli reali.
Come detto, questo è dovuto al fatto che l''ottimizzazione tende a trovare una soluzione che
sia più prossima possibile a quella ottenuta dall''inversione diretta, che essendo ottenuta da un valore di ydes molto vicino alla media dei dati a disposizione, risulta prossima all''origine dello spazio latente. Inoltre, va sottolineato che dati i bassi valori dell'' new x SPE , la differenza tra gli scores reali e quelli predetti, è dovuta alla presenza dello spazio nullo, lungo il quale si
posiziona la soluzione individuata dall''inversione diretta. Infatti, dato che giace sullo spazio nullo, come si nota da Tabella 5.6, tale soluzione assicura un valore di ynew pari a quello desiderato. 5.2.1.2. Caso 2: scenario 2 con vincolo sul tipo di polimero Come già visto al §5.1.1, anche in questo caso il problema di inversione è stato risolto vincolando il tipo di polimero da utilizzare. La soluzione ottenuta (Figura 5.7) presenta degli scores diversi da quelli ottenuti senza l''imposizione di vincoli sulle variabili di xnew, che in generale si avvicinano maggiormente a quelli reali. In questo caso tuttavia, la variabile risposta y calcolata dagli scores della soluzione, presenta un valore diverso rispetto a quella desiderata, poiché in questo algoritmo non vi è alcun vincolo che assicuri l''uguaglianza tra 110 Capitolo 5 ydes e ynew (Tabella 5.7). In altre parole, nell''inversione effettuata secondo lo scenario 2 non si sfrutta la possibilità di spostarsi lungo lo spazio nullo per ricercare una soluzione che rispetti i vincoli imposti su xnew. Tabella 5.7. Inversione del modello JY-PLS per determinare le condizioni di
processo di un campione dell''apparecchiatura CIJM-d2, tramite lo scenario
2, in cui viene fissato il tipo di polimero: confronto tra i parametri reali e
quelli stimati. Cpol FR W/A Typepol y xreal yreal Valori reali 1.47 3 1 1 335.1 xnew ynew Valori calcolati 1.51 40.37 3.95 1 299.72
Dall''esame dei valori riportati in Tabella 5.7 si nota come la soluzione si avvicina alle condizioni di processo con cui è stato ottenuto il campione estratto. Tuttavia si osserva che il valore della portata è ancora molto più elevato rispetto a quello reale ed anche il rapporto W/A. Mentre quest''ultimo non sembra avere particolare influenza sulle dimensioni delle
nanoparticelle, all''aumentare della portata invece si registra solitamente una diminuzione dei
diametri. Questo effetto è visibile nei valori delle variabili ottenuti dall''inversione. Dal grafico degli scores (Figura 5.7) si osserva infatti come gli scores stimati (tnew,') siano traslati verso il basso lungo il cluster che identifica i campioni ottenuti con il polimero PCL80 rispetto alla proiezione del campione reale (treal,'): si ricorda, dall''analisi del modello JY- PLS sulle due apparecchiature in esame (§4.1.2.2, Figura 4.5), che i weights della variabile portata si posizionano esattamente sul terzo quadrante. L''effetto risultante è quindi che la variabile risposta ynew ottenuta da: ' j new new Q t y ' , presenta un valore minore rispetto a quello reale. In questo caso inoltre l'' new x SPE (~10 -6) di x new e il T 2 (1.37) sono maggiori rispetto al caso precedente, ma rimangono abbondantemente al di sotto dei rispettivi limiti. Trasferimento di prodotto tra apparecchiature diverse 111 -0.2 0.0 0.2 -0.2 -0.1 0.0 0.1 0.2 CIJM-d1
CIJM-d2
t new t real S cor es su LV 2 Scores su LV1 Figura 5.7. Inversione del modello JY-PLS con 2 LV per determinare le condizioni di
processo di un campione dell''apparecchiatura CIJM-d2: per l''apparecchiatura CIJM-d1 e
CIJM-d2 e scores del campione estratto reali e calcolati dall''inversione, dopo aver fissato
il tipo di polimero. 5.2.1.3. Caso 3: scenario 3 in assenza di vincoli sul tipo di polimero Dal momento che lo scopo è di calcolare delle condizioni di processo che permettano di ottenere esattamente un certo valore della dimensione delle particelle, si è tentato di migliorare la soluzione utilizzando l''approccio relativo allo scenario 3 (§2.2.2.3). Questo
approccio all''inversione del modello è stato sviluppato per permettere l''imposizione di vincoli di qualsiasi natura sia su y sia su x, quindi può esser utilizzato anche per il problema trattato. Il vantaggio della nuova funzione obiettivo utilizzata, è di ricercare una soluzione che permetta di ottenere il valore desiderato per la variabile risposta (vincolo soft su ydes). Non sono stati imposti vincoli sul tipo di polimero, ma solo i vincoli fisici sulle quattro variabili. I pesi utilizzati sono equivalenti a quelli proposti nel Capitolo 2 (§2.2.2), eccetto il peso per la statistica T 2, imposto pari a zero: in questo modo il vincolo soft su T2 presente nell''espressione, viene rimosso, dal momento che non si ritiene necessario includerlo, essendo il valore desiderato ydes ampiamente all''interno del range dei dati usati per costruire il
modello. Questo vincolo infatti porterebbe l''ottimizzatore a muovere gli scores della soluzione xnew sullo spazio nullo verso il centro del piano, allontanandola dal valore reale. Anche in questo caso è da sottolineare che le variabili latenti considerate nel modello JY-PLS sono 2, per le stesse motivazioni presentate precedentemente. Dai risultati riportati in Tabella 5.8 si nota come la stima delle variabili in xnew migliori notevolmente, mentre il valore della variabile ynew rimane pressoché uguale a quello desiderato, ovvero le proiezioni di questa soluzione appartengono allo spazio nullo. La concentrazione e il tipo di polimero, che si ricordano essere dipendenti nel dataset usato per costruire il modello, presentano valori identici a quelli del campione reale, probabilmente a causa del fatto che la loro varianza è catturata dalla prima variabile latente. Anche la portata assume un valore molto prossimo a quello reale, nettamente inferiore alle stime effettuate dai 112 Capitolo 5 modelli precedenti. Il valore della variabile W/A rimane invece lontano da quello reale anche con questo modello, come aspettato dal momento che W/A non è adeguatamente descritto dalle prime due variabili latenti. Tabella 5.8. Inversione del modello JY-PLS per determinare le condizioni di
processo di un campione dell''apparecchiatura CIJM-d2, tramite lo scenario
3: confronto tra i parametri reali e quelli stimati. Cpol FR W/A Typepol y t1 t2 xreal yreal treal Valori reali 1.47 3 1 1 335.1 -4.5·10 -2 1.6·10-1 xnew ynew tnew Valori calcolati 1.47 8.40 4.42 1 335.1 -4.3·10 -2 1.7·10-1 -0.2 0.0 0.2 -0.2 -0.1 0.0 0.1 0.2 CIJM-d1
CIJM-d2
t new t real S cor es su LV 2 Scores su LV1 Figura 5.8. Inversione del modello JY-PLS con 2 VL per determinare le condizioni di
processo di un campione dell''apparecchiatura CIJM-d2: scores per l''apparecchiatura
CIJM-d1 e CIJM-d2 e scores del campione estratto reali e calcolati dall''inversione. Il valore di T 2 (3.10) rimane ancora al di sotto dei limiti, come il valore di new x SPE , particolarmente prossimo a zero. Questo valore è dovuto alla minimizzazione della funzione obiettivo utilizzata e al valore di tolleranza imposto per la soluzione. ' da precisare riguardo a questo, che è stato imposto un valore di tolleranza nella soluzione della minimizzazione, particolarmente basso in tutti i modelli, perché con valori più elevati le soluzioni si dimostravano dipendenti dai valori iniziali. Questo è probabilmente dovuto al fatto che la funzione obiettivo da minimizzare, presenta un andamento molto appiattito. Per accertare la consistenza del minimo assoluto, prima di abbassare il valore di tolleranza, si è proceduto in
modo iterativo manualmente, imponendo come valore iniziale la soluzione dell''iterazione precedente. Trasferimento di prodotto tra apparecchiature diverse 113 Dall''osservazione del grafico degli scores rispetto alle due variabili latenti (Figura 5.8), si nota come gli scores stimati (tnew,') siano molto prossimi a quelli del campione reale (treal,'), ulteriore conferma dell''ottima soluzione ottenuta con questa metodologia di inversione. 5.2.2. Importanza dello spazio nullo ' stato introdotto nel Capitolo 2 il concetto di spazio nullo, ossia il sottospazio dello spazio
latente del modello, a cui appartengono le proiezioni di tutte le soluzioni dell''inversione x new che assicurano la stessa qualità y (Jaeckle and MacGregor, 1998). Tale spazio ha dimensione pari alla differenza tra il numero di variabili latenti considerate nel modello e la dimensione latente di Y. Vengono di seguito riportati due casi di studio per la verifica dello spazio nullo: nel primo caso si considera uno spazio monodimensionale, mentre nel secondo bidimensionale. 5.2.2.1. Spazio nullo monodimensionale: approccio 1 Nel caso in esame si considerano 2 variabili latenti per la costruzione del modello in cui è presente una sola variabile risposta, per cui lo spazio nullo si riduce ad uno spazio monodimensionale. Sfruttando la definizione di spazio nullo, la soluzione può essere variata lungo questo senza modificare la variabile risposta, ossia dai punti dello spazio nullo si possono ricostruire una serie di condizioni operative diverse da quelle ottenute con
un''inversione diretta, che in linea teorica dovrebbero assicurare la stessa qualità del prodotto.
Lo scopo di questo lavoro è di dimostrare l''esistenza fisica di questo spazio, cioè di verificare sperimentalmente che le condizioni ottenute lungo lo spazio nullo, restituiscano particelle dal diametro desiderato. I punti che identificano lo spazio nullo nello spazio degli scores, sono calcolati tramite
l''espressione (2.74) (§2.2.2.4), ottenendo una retta (spazio nullo monodimensionale) nel
piano latente del modello (Figura 5.11), passante per il punto corrispondente all''inversione diretta (§2.2.2.3). Lungo questa retta, le condizioni di processo che teoricamente restituiscono la stessa dimensione delle particelle del campione di partenza, sono in numero infinito.
Per verificare l''esistenza dello spazio nullo, ossia per verificare che effettivamente a questa retta appartengano diverse condizioni di processo che portino ad ottenere la stessa variabile risposta, si sono individuati 6 punti in posizioni diverse lungo lo spazio nullo, corrispondenti a 6 diverse combinazioni di variabili operative utilizzabili in ambito sperimentale. I set xi,null ricostruiti dalle proiezioni sullo spazio nullo selezionate, presentano i valori di alcune variabili come il tipo di polimero e il rapporto non solvente/solvente, non riproducibili sperimentalmente. Questo implica la necessità di vincolare questi valori per trovare una 114 Capitolo 5 soluzione del problema testabile sperimentalmente. Il procedimento seguito per ciascuno dei 6 punti selezionati lungo lo spazio nullo può esser così riassunto:
' verifica dei valori delle variabili di ciascun set di condizioni operative (x null): se Typepol non è 1 o 0 e se W/A non assume uno dei valori riproducibili sperimentalmente, è necessario vincolarli; ' per assicurare l''appartenenza della soluzione allo spazio nullo viene sfruttato il seguente approccio: new x new min SPE x (5.1) In cui: 95 %lim T SPE g SPE x, x x x x '' ' ' ' ' 2 new new new new new x ) ' )( ' ( (5.2) T null T new t t ' (5.3) T new new ' Q t y ' (5.4) T new new ' P t x ' (5.5) * new new ' W x t ' (5.6) (5.7) e i i , new c ' x (5.8) i i , new d ' x (5.9) x x x i i i ub lb ' ' new, e y y y i i i ub lb ' ' des, (5.10) In questo problema di ottimizzazione, che segue uno schema simile a quello dello scenario 2 (§2.2.2.2) a cui si rimanda per il significato dei termini, viene ricercata una soluzione che
minimizzi l'' new x SPE ma che rispetti il vincolo hard imposto su tnew. Il valore di tale vincolo (tnull), è pari ad uno dei sette punti individuati lungo lo spazio nullo, di cui si ricercano le condizioni che rispettino i vincoli imposti (su Typepol e W/A). In Figura 5.9 sono riportati gli scores dei campioni dei dataset relativi alle apparecchiature
in esame ('' per CIJm-d1 e ' per CIJM-d2) nel piano individuato dalle prime 2 variabili latenti, e gli scores delle condizioni di processo lungo lo spazio nullo ('), individuato dalla retta rappresentata. Si nota che per ottenere particelle di diametro 335.1 nm, si possono utilizzare entrambi i tipi di polimero (identificati dai due gruppi di proiezioni in Figura 5.9), ma in concentrazione e con valori di portata diversi. Trasferimento di prodotto tra apparecchiature diverse 115 -0.2 -0.1 0.0 0.1 0.2 0.3 -0.2 -0.1 0.0 0.1 0.2 6 5 4 3 2 CIJM-d1
CIJM-d2
t new t real Spazio nullo S cor e su LV 2 Scores su LV1 1 Figura 5.9. Verifica dello spazio nullo: scores del modello JY-PLS per l''apparecchiatura
CIJM-d1 e CIJM-d2 e scores reali del campione in esame e calcolati dall''inversione con il
vincolo di appartenenza allo spazio nullo. Il risultato della procedura esposta è riportato in Tabella 5.9 dove si presentano le 6 condizioni di processo risultanti dalla soluzione del problema di ottimizzazione in (5.1) per ciascuno dei 6 punti individuati lungo lo spazio nullo. La convalida sperimentale di queste condizioni è riportata al §5.2.2.3. Tabella 5.9. Inversione del modello JY-PLS per determinare le condizioni di
processo di un campione dell''apparecchiatura CIJM-d2 lungo uno spazio
nullo monodimensionale: condizioni stimate per 6 diversi campioni. Cpol [mg/ml] FR [ml/min] W/A [-] Typepol SPExnew xreal 1.47 3 1 PCL80 9.9·10 -3 xnew1 1.48 10.3 5.2 PCL80 5.2·10 -4 xnew2 1.99 17.2 5.2 PCL80 9.6·10 -4 xnew3 2.88 24.3 2.9 PCL80 3.3·10 -3 xnew4 3.44 80.3 2.9 PCL14 2.6·10 -3 xnew5 4.14 89.9 2.9 PCL14 8.2·10 -4 xnew6 5.04 101.9 2.8 PCL14 3.2·10 -7 Come è possibile notare da Figura 5.9, lo spazio nullo attraversa sia l''insieme dei campioni ottenuti con il polimero PCL80 a cui appartiene il campione di riferimento estratto dalla
matrice, sia l''insieme dei campioni di PCL 14: si osserva come a mano a mano che ci si sposta lungo lo spazio nullo, dal secondo al quarto quadrante nel piano degli scores, aumenta la concentrazione di polimero e la portata necessarie per ottenere lo stesso diametro. Questo andamento è compatibile con le osservazioni delle relazioni effettuate nel Capitolo 4 sul modello JY-PLS costruito su questi dati (§4.1.2.2): dal momento che in generale con il polimero PCL14 si ottengono particelle a dimensione maggiore, ed è sempre utilizzata una concentrazione maggiore con questo tipo di polimero, ci si aspetta che il valore della portata aumenti, dato che questo favorirebbe la formazione di particelle a diametro inferiore. 116 Capitolo 5 ' necessario considerare che lo spazio nullo è affetto da incertezze, che sono conseguenza
dell''incertezza nella stima dei parametri del modello. Per tener conto di queste incertezze sono stati stimati i limiti di confidenza dello spazio nullo, che vengono riportati in Figura 5.10a, secondo la procedura presentata nel Capitolo 2 (§2.2.2.5).
Questi limiti rappresentano l''incertezza nella stima di ogni punto dello spazio nullo: come si nota dal piano degli scores (Figura 5.10a) i limiti sono molto stretti, come conseguenza del fatto che in questo caso studio, vi è realmente una direzione nello spazio latente che non ha influenza su y. Infatti essendo tale risposta monodimensionale, presenta una sola direzione latente, e tutto lo spazio rimanente non essendo influente, forma lo spazio nullo. Inoltre, il modello rappresenta in modo adeguato i campioni in esame, ossia la differenza tra le condizioni di processo di ogni campione e la loro proiezione sul piano individuato dalle variabili latenti è molto bassa. -0.2 -0.1 0.0 0.1 0.2 -0.3 -0.2 -0.1 0.0 0.1 0.2 0.3 Limiti spazio nullo Spazio nullo
t REAL t NEW CIJM-d2
CIJM-d1 Sc o re s s u L V2 Scores su LV1 (a) 0.050 0.055 0.060 0.065 0.070 -0.16 -0.15 -0.14 -0.13 Limiti spazio nullo Limiti x NEW Spazio nullo
t NEW CIJM-d2 Sc o re s s u L V2 Scores su LV1 (b) Figura 5.10. (a) Limiti di confidenza al 95 % per lo spazio nullo e (b) particolare che
evidenzia l''ellisse di confidenza per la soluzione stimata. Analogamente, sono state calcolate le incertezze sulla stima di xnew, rappresentate dall''ellisse di confidenza molto appiattita in Figura 5.10b. In questo caso, sono stati stimati i limiti per
l''ultimo set di condizioni stimato, relativo al polimero PCL 14 (xnew6 in Tabella 5.9). Per consentire la visualizzazione dell''entità di tali limiti, si è riportato in Figura 5.10b il settore del piano in cui giace la soluzione stimata. La forma dell''ellisse è dovuta essenzialmente al vincolo imposto sul tipo di polimero. La soluzione dell''inversione del modello trovata ad ogni iterazione del metodo jackknife, dovendo rispettare questo vincolo e il vincolo sul valore imposto degli scores sullo spazio nullo si sposta principalmente lungo la direzione della prima variabile latente, dal momento che questa spiega la maggior parte della varianza della variabile Typepol su cui è imposto il vincolo.
Questi limiti sono particolarmente utili in fase di verifica dell''esistenza dello spazio nullo: anche se le condizioni sperimentali dovessero variare, rimanendo comunque prossime a quelle Trasferimento di prodotto tra apparecchiature diverse 117 stimate dal modello, è sufficiente che giacciano all''interno dei limiti di confidenza calcolati
per poter essere ritenute comunque accettabili dal punto di vista dell''incertezza del modello. 5.2.2.2. Spazio nullo mono e bidimensionale: approccio 2 Secondo le considerazioni fatte nel precedente paragrafo e dai risultati ottenuti, sono
sufficienti 2 variabili latenti affinché l''inversione del modello JY-PLS risulti soddisfacente. Dal momento però, che la terza variabile latente spiega quasi il 25% della varianza spiegata della matrice 2 CIJMd PCL X , è stato esaminato anche questo caso, che si mostra particolarmente interessante poiché lo spazio nullo diventa bidimensionale.
Questo caso è simile all''inversione effettuata al paragrafo 5.1.1 in cui si sono utilizzate 4 variabili latenti: la varianza spiegata per la matrice è pari al 100% di quella totale, per cui, se
si utilizza l''approccio relativo allo scenario 2, non vi è soluzione per il problema di ottimizzazione, se non rilassando il vincolo su new x SPE , riducendo così il calcolo ad un''inversione diretta. Senza la presenza di altri vincoli se non quelli fisici (§5.1.1), la soluzione stimata con questo approccio (qui non riportata) presenta scores e variabili di processo con valori intermedi a quelli presenti nel dataset. Se la stessa inversione viene effettuata utilizzando lo scenario 3, in assenza di vincoli su new x SPE e su T 2, gli scores stimati sono molto vicini a quelli reali, ma le condizioni di processo stimate non sono fisicamente accettabili. Solo imponendo a priori vincoli stretti sul tipo di polimero, sul rapporto non solvente/solvente e su una tra la portata
all''ingresso e la concentrazione di polimero, si raggiunge una soluzione molto prossima a quella reale. Questo è dovuto al fatto che lo spazio nullo in cui si ricerca la soluzione, è più grande e sono necessari più vincoli per raggiungere i valori fisicamente accettabili per tutte le variabili. Come detto sopra, l''utilizzo di 3 variabili latenti, offre la possibilità di studiare la presenza di uno spazio nullo bidimensionale, infatti la differenza fra il numero di variabili latenti e la variabile risposta è 2. Invece di utilizzare la stessa procedura impiegata al paragrafo 5.2.2.1 (approccio 1) per determinare i punti appartenenti allo spazio nullo, si è ricercata un''alternativa più generale che non prevedesse di selezionare e imporre a priori gli scores d''interesse. Dal punto di vista geometrico, in questo caso lo spazio nullo rappresenta un piano che si estende nello spazio tridimensionale creato dalle 3 VL del modello. Il problema di trovare un punto appartenente allo spazio nullo che soddisfi al contempo i vincoli che vengono imposti sugli elementi del vettore xnew è stato affrontato implementando un nuovo problema di ottimizzazione, nel quale la condizione di appartenenza del punto allo spazio nullo è assicurata minimizzando la distanza (d) tra il punto e lo spazio nullo medesimo, che nella forma generale, indicando lo spazio nullo come generico iperpiano H può esser scritta come in (5.11): 118 Capitolo 5 ' ' a b t a ' ' new , d (5.11)
in cui:
' a è il vettore dei coefficienti dell''equazione cartesiana dell''iperpiano H;
' b è il termine noto dell''equazione cartesiana dell''iperpiano H;
' t new è il vettore degli scores del punto d''interesse, la cui distanza da H viene minimizzata. Per determinare a e b è necessario risolvere il sistema che impone il passaggio del piano descritto tramite i suoi vettori giacitura rappresentati dalla matrice G2 attraverso un punto di interesse, in questo caso rappresentato da tdes (2.74). Per limitare la distanza della soluzione dal piano individuato dalle variabili latenti e per assicurare che giaccia nel range degli scores dei campioni del dataset con cui è stato costruito il modello, si aggiungono vincoli di tipo soft rispettivamente su new x SPE e su T 2, nella stessa forma e con gli stessi pesi utilizzati nel caso dello scenario 3 (§2.2.2.3) ottenendo il seguente problema di inversione: ' ' n ew n ew 2 1 2 2 3 new , min x x a b t a SPE g s t g A a a a '' ' '' ' ' '' ' ' '' ' ' ' ' (5.12) In cui: * new new W x t ' (5.13) T new new ' P t x ' (5.14) T new new ' Q t y ' (5.15) 95 %lim T SPE g SPE x, x x x x '' ' ' ' ' 2 new new new new x ) ' )( ' ( new (5.16) i i , new c ' x (5.17) i i , new d ' x (5.18) x x x i i , new i ub lb ' ' e y y y i i , des i ub lb ' ' (5.19) Si rimanda alla descrizione dello Scenario 3 nel Capitolo 2 (§2.1.1.6) per il significato dei simboli utilizzati nelle equazioni (5.13)-(5.19). Innanzitutto si è voluto utilizzare questa nuova procedura nel caso in cui si considerano solo 2 variabili latenti per il modello. Lo spazio nullo si riduce a monodimensionale, e la funzione obiettivo minimizza la distanza tra un punto e la retta, con entrambi i vincoli sulle statistiche della soluzione. Trasferimento di prodotto tra apparecchiature diverse 119 Si vincolano le variabili che in fase sperimentale possono assumere solo determinati valori, ovvero il tipo di polimero e il rapporto non solvente/solvente; viene rimosso invece il vincolo soft sul T 2 che forzerebbe la soluzione verso il centro del piano latente. I risultati ottenuti (Tabella 5.10), imponendo gli stessi valori di W/A e Typepol di quelli imposti nella procedura descritta al §5.2.2.1, mostrano come solo per le condizioni in prossimità dei cluster dei
campioni dell''apparecchiatura CIJM-d2, si ottengano valori simili a quelli già ottenuti, negli altri casi i valori delle variabili sono nettamente diversi. Questo accade perché nel primo approccio il valore degli scores di interesse nello spazio nullo è imposto a priori, e viene ricercata una soluzione che rispetti i vincoli imposti più prossima possibile al piano del modello nel punto selezionato dello spazio nullo. Nel secondo caso invece, la soluzione è trovata in modo da minimizzare la sua distanza dal piano del modello e la distanza delle sue proiezioni dallo spazio nullo, muovendosi lungo questo per soddisfare i vincoli imposti sulle variabili di processo. In particolare, in questo caso specifico, i vincoli imposti sulle condizioni di processo, considerano la variabile W/A che non è molto importante sulle prime due variabili latenti. Di conseguenza, esistono diverse soluzioni lungo lo spazio nullo che rispettano questo vincolo. Solo imponendo un ulteriore vincolo sulla portata d''ingresso o sulla concentrazione di polimero, variabili molto influenti sulle prime due variabili latenti, si ritrovano gli stessi risultati di Tabella 5.9, perché si costringono le proiezioni della soluzione a giacere in un punto preciso dello spazio nullo. Questo conferma l''equivalenza dei due metodi applicati in uno spazio monodimensionale. Tabella 5.10. Inversione del modello JY-PLS per determinare le condizioni
di processo di un campione dell''apparecchiatura CIJM-d2 lungo uno spazio
nullo monodimensionale: verifica delle condizioni di processo stimate. Cpol [mg/ml] FR [ml/min] W/A [-] Typepol SPExnew xreal 1.47 3 1 PCL80 xnew1 1.32 8.09 5.20 PCL80 4.9·10 -4 xnew2 1.75 9.02 2.90 PCL80 1.9·10 -3 xnew3 5.02 101.83 2.90 PCL14 8.7·10 -6 xnew5 5.04 101.87 2.80 PCL14 1.9·10 -6 Lo studio è stato quindi esteso al caso di uno spazio nullo bidimensionale, in cui nuovamente si impongono a priori i valori delle variabili Typepol e W/A e si omette il vincolo su T 2, per le stesse motivazioni presentate precedentemente. In questo caso in cui si considerano 3 variabili latenti, è necessario eliminare anche il vincolo su new x SPE , per evitare problemi nell''ottimizzazione. I risultati (non riportati), differiscono da quelli ottenuti precedentemente, poiché la soluzione ora si può muovere lungo un piano e non solo lungo una retta,
dimostrando l''esistenza di ulteriori condizioni che teoricamente permettono di ottenere lo stesso prodotto desiderato. Per ottenere le stesse condizioni iniziali precedentemente stimate, è necessario imporre 3 delle 4 variabili da calcolare, per ognuno dei 6 campioni sullo spazio 120 Capitolo 5 nullo, in modo da ridurre i gradi di libertà del problema. Si è quindi deciso di imporre a priori i valori di concentrazione di polimero (Cpol), rapporto non solvente/solvente (W/A) e tipo di polimero (Typepol), in modo da ottenere una stima della portata (FR). In questo modo si ottengono risultati molto prossimi a quelli ottenuti al paragrafo 5.2.2.1. In generale, quando si ricercano nuove condizioni appartenenti allo spazio nullo, soprattutto nel caso si abbia a disposizione un ristretto numero di dati storici, è utile mantenere il vincolo su T 2 per evitare che la soluzione si assesti su valori estremi o addirittura al di fuori del range dei dati storici. La metodologia proposta però risulta molto interessante soprattutto in applicazioni in cui vi
siano, come in questo caso, dei vincoli specifici su alcune variabili: l''utilizzo dello spazio nullo dà il vantaggio di poter determinare diverse condizioni di processo che assicurano
l''ottenimento della stessa qualità di prodotto, ma tra le quali si possono ricercare quelle ottimali secondo le esigenze specifiche dettate dalla sperimentazione. 5.2.2.3. Risultati della convalida sperimentale Le condizioni operative determinate lungo lo spazio nullo per il miscelatore CIJM-d2 (Tabella 5.9) sono state testate sperimentalmente per verificare se la dimensione delle particelle ottenute corrisponde a quella desiderata (335.1 nm), rispetto alla quale è stato costruito lo spazio nullo. I risultati di queste prove sono riportati in Tabella 5.11. Solo la portata
dell''ultimo campione richiesto (valore contrassegnato da asterisco) è diversa da quella
determinata dall''inversione del modello JY-PLS per le due apparecchiature, a causa di vincoli sperimentali. Tabella 5.11. Risultati sperimentali delle condizioni operative per
apparecchiatura CIJM-d2 stimate attraverso il metodo di inversione del
modello JY-PLS lungo uno spazio nullo monodimensionale. Cpol [mg/ml] FR [ml/min] W/A [-] Typepol Dimensione delle nanoparticelle [nm] xreal 1.47 3 1 PCL80 289.5 xnew1 1.48 10.3 5.2 PCL80 264.1 xnew2 1.99 17.2 5.2 PCL80 291.8 xnew3 2.88 24.3 2.9 PCL80 287.4 xnew4 3.44 80.3 2.9 PCL14 218.4 xnew5 4.14 89.9 2.9 PCL14 227.3 xnew6 5.04 67.8* 2.8 PCL14 247.9 Innanzitutto si nota che il valore ottenuto in questi esperimenti nelle stesse condizioni di processo utilizzate negli esperimenti storici per ottenere il valore di 335.1 nm, differisce da questo di quasi il 14 % (xreal in Tabella 5.11). Osservando anche la media dei valori delle altre prove in Tabella 5.11, che ci si aspetta essere distribuiti in un intorno di 335.1 nm, questo fa presumere che tra questa campagna sperimentale e quella su cui è stato costruito il modello, vi Trasferimento di prodotto tra apparecchiature diverse 121 siano delle differenze di tipo sistematico, dovute allo strumento di misurazione o a diversi effetti sul processo difficilmente determinabili a priori, che causano la produzione di particelle in media più piccole. ' comunque importante notare che soprattutto per quanto riguarda il polimero PCL80, le diverse condizioni di processo implementate, hanno restituito particelle con valori molto vicini a 289.5 nm, ovvero al valore ottenuto in questa campagna sperimentale nelle condizioni di processo corrispondenti nel dataset storico al campione di riferimento (335.1 nm).
Per accertare l''effettiva presenza di una differenza tra le due campagne sperimentali e tentare di quantificarne il valore, si sono richieste delle nuove prove, per condizioni di processo già presenti nel dataset storico, su cui è stato costruito il modello. I risultati sono riportati in Tabella 5.12. Tabella 5.12. Risultati sperimentali richiesti per accertare la presenza di
differenze tra le due diverse campagne sperimentali. Il valore di portata
asteriscato non presenta un corrispondente nel dataset storico, per cui è
riportato un valore della dimensione delle particelle ottenuto in condizioni
più prossime possibili a quelle utilizzate. Cpol [mg/ml] FR [ml/min] W/A [-] Typepol Dimensione nanoparticelle [nm] nei nuovi esperimenti Dimensione nanoparticelle [nm] nel dataset storico Campione 1 Campione 2 1.47 40 1 PCL80 251.4 245.6 287.5 1.47 3 1.92 PCL80 272.4 243.4 334.6 1.47 120 1.92 PCL80 148.8 140.9 202.4 1.47 40 2.84 PCL80 195.3 180.7 268.5 1.47 67* 2.84 PCL80 190.1 159.0 241.6* 5.04 120 1 PCL14 255.2 245.7 319.9 5.04 80 1.92 PCL14 209.1 219.2 337.9 5.04 60 2.84 PCL14 221.3 210.1 340.9 Per ogni condizione di processo, sono stati misurati due campioni, e tali valori sono stati confrontati con quelli del dataset storico su cui è stato costruito il modello per le due
apparecchiature. Dall''osservazione dei risultati in Tabella 5.12, viene confermata la presenza di una sostanziale differenza tra le campagne sperimentali, ovvero i valori delle particelle si presentano sempre inferiori rispetto a quelli ottenuti dagli esperimenti storici. Per considerare tale scostamento, si è costruita una retta di regressione tra i valori del dataset storico riportati in Tabella 5.12 (ultima colonna) e i valori ottenuti dai nuovi esperimenti effettuati alle stesse condizioni (quinta e sesta colonna di Tabella 5.12). Questo è stato fatto sia per poter valutare
se l''andamento dei nuovi dati ottenuti riflette quello dei dati del dataset storico, sia con
l''obiettivo di utilizzare tale regressione come modello di correzione dei valori di diametro ottenuti da nuove prove sperimentali. 122 Capitolo 5 180 200 220 240 260 280 300 320 340 360 140 160 180 200 220 240 260 280 R 2=0.646 y=0.669+18.321 PCL 80 PCL 14 C am pion i della ca mp agn a n .2 Campioni della campagna n.1 Figura 5.11. Regressione lineare tra i dati della prima campagna sperimentale in ascissa e
della seconda campagna di sperimentazioni in ordinata per il dati del polimero PCL14 e
relativa equazione della retta interpolatrice. Tale regressione è riportata in Figura 5.11. Come si può notare, una regressione lineare non è
abbastanza rappresentativa dell''andamento dei dati riportati, in quanto l''R2 (0.646) è lontano dall''unità. Inoltre si nota chiaramente che alcuni dei campioni del polimero PCL14 (') non sembrano dimostrare lo stesso andamento di quelli per il PCL80 (''), dato che a parità
d''ascissa presentano un''ordinata molto inferiore. Dal momento che si è notato, anche dalla semplice osservazione dei dati, che le differenze tra i campioni dei due polimeri sembrano avere andamenti diversi, si è optato per costruire una regressione solo sui dati del polimero PCL80. Infatti, per il PCL14 non si hanno dati a sufficienza per costruire un modello sufficientemente rappresentativo e non si hanno abbastanza informazioni per comprendere le
cause che provocano l''effetto osservato. La nuova retta di regressione, e le relativa funzione sono riportate in Figura 5.12. 200 220 240 260 280 300 320 340 140 160 180 200 220 240 260 280 R 2=0.866 y=0.886-34.949 C am pion i della ca mp agn a n .2 Campioni della campagna n.1 Figura 5.12. Regressione lineare tra i dati del dataset storico in ascissa e i corrispondenti
dati della nuova campagna di sperimentazioni in ordinata per i dati del polimero PCL80 . Si sfrutta pertanto l''equazione della retta di regressione individuata, per correggere i valori dei diametri ottenuti dagli esperimenti effettuati sui punti dallo spazio nullo (Tabella 5.11) in Trasferimento di prodotto tra apparecchiature diverse 123 modo da poterli confrontare con il valore di riferimento per il quale è stato calcolato lo spazio nullo (ydes = 335.1 nm). I risultati di tale procedura sono riportati in Tabella 5.13. Tabella 5.13. Valori determinati sperimentalmente e valori ricalcolati
tramite l''equazione della retta di regressione, dei diametri ottenuti
implementando le condizioni di processo identificate lungo lo spazio nullo. Dimensione nanoparticelle [nm] Dimensione nanoparticelle ricalcolate [nm] Errore relativo rispetto a 335.1 nm xreal 289.5 366.2 -9.3% xnew1 264.1 337.5 -0.7% xnew2 291.8 368.7 -10.0% xnew3 287.4 363.8 -8.6% xnew4 218.4 285.9 14.7% xnew5 227.3 296.0 11.7% xnew6 247.9 319.2 4.7% I risultati ottenuti, sia osservando individualmente i valori ottenuti, sia in termini di errore relativo rispetto al valore desiderato di 335.1 nm, si presentano molto soddisfacenti, in quanto
sono tutti al di sotto dell''errore accettato dagli sperimentatori. Si nota infatti che l''errore relativo è al di sotto del 10% per il polimero PCL80. Gli errori per il polimero PCL14 si dimostrano in media maggiori, ma comunque inferiori al 15%. Questo può esser dovuto al fatto che la differenza fra le campagne sperimentali è più incerta per il secondo tipo di polimero e inoltre il campione di riferimento a 335.1 nm è stato ottenuto con il polimero PCL80. Questi risultati dimostrano come le condizioni operative individuate lungo lo spazio nullo, permettano, come teorizzato, di ottenere particelle con un diametro simile a quello desiderato, e quindi vi sia la reale possibilità di muovere la soluzione lungo questo spazio per ricercare le condizioni più adatte al problema in esame, senza sostanzialmente modificare la qualità del prodotto. 5.2.3. Trasferimento per ottenere particelle al di sotto di un certo
diametro Un ulteriore problema affrontato in questo lavoro, è la stima di condizioni di processo che permettano di ottenere delle particelle con un diametro minore di una certa soglia. Una volta ottenute tali condizioni, sono state richieste prove sperimentali di convalida, per valutare
l''efficacia della tecnica. Il valore scelto è pari a 200 nm, poiché questa dimensione assicura delle buone prestazioni per le applicazioni delle nanoparticelle: è accettabile una dimensione fino a 250 nm. In questo caso non sussiste un vincolo di uguaglianza per y, ma di disuguaglianza, per cui è
necessario utilizzare l''approccio presentato nello scenario 3 (§2.2.2.3). 124 Capitolo 5 I vincoli fisici sulle variabili di processo rimangono gli stessi imposti precedentemente. Nella prima prova non si impongono ulteriori vincoli. Tabella 5.13. Inversione del modello JY-PLS per determinare le condizioni
di processo per ottenere un campione con un diametro minore di 200 nm con
l''apparecchiatura CIJM-d2, tramite lo scenario 3: parametri stimati, senza
aver fissato nessuna variabile. Cpol FR W/A Typepol y t1 t2 xnew ynew tnew Valori calcolati 0.777 119.3 2.84 1 200 -2.2·10 -1 -8.1·10-2 Tabella 5.14. Inversione del modello JY-PLS per determinare le condizioni
di processo per ottenere un campione con un diametro minore di 200 nm con
l''apparecchiatura CIJM-d2, tramite lo scenario 3: parametri stimati avendo
fissato portata, tipo di polimero e rapporto W/A. Cpol FR W/A Typepol y t1 t2 xnew1 ynew2 tnew1 Valori calcolati 0.82 120 2.9 1 200 -2.2·10 -1 -8.3·10-2
Si osserva da Tabella 5.13 come il modello stimi senza specificare vincoli, l''utilizzo del polimero PCL80 come migliore scelta per ottenere particelle di dimensioni minori con questo tipo di apparecchiatura, ad una portata elevata ed ad una bassa concentrazione di polimero. Dato che il valore stimato è prossimo a quello limite di 120 mL/min utilizzato nelle prove, si impone a priori un vincolo su tale valore, assieme al valore di W/A possibile in queste
condizioni, per ricavare un''ulteriore soluzione (x new1) sperimentalmente fattibile. I risultati nei due casi si mostrano plausibili e molto simili, data la prossimità della soluzione con le condizioni imposte (Tabella 5.14) rispetto a quelle stimate nel primo caso (Tabella 5.13): per entrambi l'' new x SPE (rispettivamente 4.8·10 -4 e 4.3·10-4) e il T2 (3.51 per entrambi) rimangono al di sotto dei limiti di confidenza, assicurando che la soluzione è molto prossima alle condizioni di processo dei dati storici. Per trovare ulteriori condizioni che soddisfino il limite sperimentale dovuto alla portata, si è imposto a priori il valore della concentrazione di polimero, pari a 0.5 mg/ml, inferiore al caso precedente. Trasferimento di prodotto tra apparecchiature diverse 125 Tabella 5.15. Inversione del modello JY-PLS per determinare le condizioni
di processo per ottenere un campione con un diametro minore di 200 nm con
l''apparecchiatura CIJM-d2, tramite lo scenario 3: parametri stimati avendo
fissato concentrazione, tipo di polimero e rapporto W/A. Cpol FR W/A Typepol y t1 t2 xnew2 ynew2 tnew2 Valori calcolati 0.5 115.7 2.9 1 200 -2.2·10 -1 -6.9·10-2 Questa scelta è stata suggerita dallo studio sul sistema effettuato nel Capitolo 3 (§ 3.2), in cui si è dedotto che con concentrazioni maggiori si ottengono in generale dimensioni superiori delle particelle. I risultati (Tabella 5.15) confermano tale ipotesi, infatti la portata necessaria stimata dal modello è pari a 115 mL/min, inferiore al caso precedente. Anche in questo caso le condizioni stimate (xnew1) si posizionano entro i limiti del T 2 (3.4) e in prossimità del piano identificato da LV1 e LV2, dato il basso valore dell'' new x SPE (9.5·10 -4). In base a questi risultati si evita la ricerca di condizioni in cui la portata sia ulteriormente inferiore a quella determinata, dal momento che ciò comporterebbe il rischio di ricercare valori di concentrazione estremamente bassi, con i quali le prove sono più sensibili ad errori e meno riproducibili. Si ricercano quindi delle nuove condizioni con valori di concentrazione equivalenti a quelli utilizzati nelle prove del dataset storico su cui è stato costruito il modello JY-PLS. Per esempio si utilizza una concentrazione pari a 1.47 mg/mL, imponendo tale valore come vincolo nel problema di ottimizzazione da risolvere, ma senza porre ulteriori vincoli oltre a quelli fisici. In queste condizioni, non viene raggiunta nessuna soluzione entro i limiti fisico- sperimentali imposti, neppure rilassando i vincoli per new x SPE , per cui è necessario aumentare il valore del vincolo di disuguaglianza imposto per la dimensione delle particelle. Dal momento che sono accettabili diametri fino a 250 nm, viene imposto tale limite per trovare delle condizioni che assicurino di ottenere delle particelle con diametro simile a questo. In tali condizioni, è necessario imporre anche il tipo di polimero, poiché spontaneamente la soluzione stimata restituisce un valore prossimo (ma non equivalente) ad 1. Tabella 5.16. Inversione del modello JY-PLS per determinare le condizioni
di processo per ottenere un campione con un diametro minore di 250 nm con
l''apparecchiatura CIJM-d2, tramite lo scenario 3: parametri stimati, avendo
fissato concentrazione, tipo di polimero e rapporto W/A. Cpol FR W/A Typepol y t1 t2 xnew3 ynew3 tnew3 Valori calcolati 1.47 83.1 2.9 1 250 -1.5·10 -1 -6.8·10-3 126 Capitolo 5 La soluzione stimata (Tabella 5.16) è plausibile in base alla conoscenza sul processo: la portata è elevata ma al di sotto del limite sperimentale. La soluzione trovata (xnew3) presenta un basso valore di T 2 (1.30) e un new x SPE (1.5·10 -4) al di sotto del limite, come richiesto. Il confronto della posizione sul piano degli scores delle 3 soluzioni calcolate per ottenere particelle inferiori a 200 nm e a 250 nm, é riportato in Figura 5.15. Si nota come gli scores della soluzione per y ' 250 nm, ottenuti imponendo la concentrazione di polimero pari a 1.47 ('), appartengano al cluster dei campioni storici ottenuti con la stessa concentrazione iniziale, che si dispongono sulla sinistra del piano. Gli scores delle soluzioni ottenute per y ' 200 nm, a concentrazioni inferiori (','), si trovano invece traslati rispetto ai campioni storici, in base alla diversa portata e concentrazione. -0.2 0.0 0.2 -0.2 -0.1 0.0 0.1 0.2 CIJM-d1
CIJM-d2
t new a C pol =0.5 t new a C pol =0.82 t new a C pol =1.47 S cor es su LV 2 Scores su LV1 Figura 5.15. Inversione per ottenere particelle con un diametro sotto una certa soglia con
CIJM-d2: scores dei campioni di CIJM-d1 e CIJM-d2 e scores stimati per y'200 o y'250. 5.2.3.1. Risultati della convalida sperimentale Per valutare la capacità della procedura utilizzata nel determinare condizioni operative adatte ad ottenere particelle di dimensioni inferiori o uguali ad una certa soglia con l''apparecchiatura CIJM-d2, si è richiesta verifica sperimentale dei risultati esposti al §5.2.3, di cui si riportano in Tabella 5.23 i risultati. Anche in questo caso, i valori ottenuti delle dimensioni delle particelle da confrontare con i valori imposti come vincolo di disuguaglianza (200 o 250 nm), sono stati ricalcolati a partire da quelli ottenuti sperimentalmente, sfruttando il modello lineare di regressione esposto al §5.2.2.3, in quanto anche in questo caso si suppone la presenza di differenze, fra i risultati della campagna sperimentale utilizzati per la costruzione del modello di inversione e quelli di seguito presentati utilizzati per la convalida del modello. Da Tabella 5.23, si osserva come la dimensione delle particelle ottenute, sia molto prossima a quella desiderata, con errori relativi al massimo del 5%. Trasferimento di prodotto tra apparecchiature diverse 127 Tabella 5.23. Valori determinati sperimentalmente e valori ricalcolati
tramite l''equazione della retta di regressione, dei risultati ottenuti
implementando le condizioni di processo identificate per ottenere particelle
al di sotto di una certa soglia. Cpol [mg/ml] FR [ml/min] W/A [-] Typepol Dimensione delle nanoparticelle [nm] Dimensione delle nanoparticelle ricalcolate [nm] Errore relativo rispetto a quello desiderato xnew1 0.5 115.7 2.9 PCL80 143.3 201.2 -0.6% xnew2 0.83 120 2.9 PCL80 151.3 210.2 -5.1% xnew3 1.47 83 2.9 PCL80 192.4 256.6 -2.6% Questi ottimi risultati dimostrano la capacità del modello implementato di individuare delle condizioni operative sperimentalmente applicabili e adeguate a rispondere alle esigenze del processo in esame. 5.2.4. Conclusioni In questo Capitolo si sono presentati i risultati ottenuti mediante l''inversione di modelli JY- PLS per la ricerca delle condizioni operative adatte alla produzione di nanoparticelle di dimensione desiderata. Questi risultati hanno dimostrato che:
' è necessario scegliere adeguatamente il numero di variabili latenti nel caso in cui si utilizzi uno scenario diverso da quello che prevede una semplice inversione diretta. Il numero di variabili latenti necessarie dipende dalla varianza delle variabili di processo con maggior influenza sulla dimensione delle nanoparticelle che esse sono in grado di catturare. ' Il modello implementato si dimostra sufficientemente robusto al variare del numero di campioni considerati nelle matrici che lo costituiscono. I risultati dell''inversione iniziano a peggiorare oltre il 30% di campioni eliminati. ' In tutte le prove in cui si utilizza lo scenario 2, si ottengono in generale risultati migliori vincolando il tipo di polimero, poiché questa è una variabile influente sulla dimensione delle particelle ed è importante soprattutto lungo la prima variabile latente. Inoltre questo vincolo risulta necessario dal momento che la variabile in considerazione è di tipo binario,
e il risultato dell''inversione porta invece ad una soluzione con valori medi rispetto a questa variabile. Una possibile alternativa da testare in futuro è quella di utilizzare metodi di ottimizzazione a valori interi. ' Nelle prove di inversione per ottenere le condizioni operative da utilizzare con l''apparecchiatura CIJM-d2 per ottenere una dimensione delle particelle già ottenuta in CIJM-d1, l''utilizzo dello scenario 3 mostra i risultati migliori. ' Lungo lo spazio nullo è possibile ricercare diversi set di condizioni operative in grado di assicurare lo stesso prodotto: questo è stato confermato da prove sperimentali effettuate su 6 diversi punti dello spazio nullo, per ottenere particelle di dimensione 335.1 nm. Per i 128 Capitolo 5 campioni ottenuti utilizzando lo stesso polimero (PCL80) con cui è stato ottenuto il
campione desiderato, l''errore si assesta in media intorno al 7%, mentre è di poco superiore
con l''utilizzo di un polimero diverso (PCL 14). ' Si sono ottenuti ottimi risultati dalla convalida sperimentale delle condizioni operative trovate per ottenere particelle inferiori a 200 o 250 nm: l''errore in questo caso è in media del 3%, dimostrando la validità di tale procedura. Conclusioni In questa Tesi è stata proposta una procedura robusta e industrialmente applicabile per affrontare il problema del trasferimento di prodotto tra diversi impianti, nella ricerca di un intervallo di condizioni operative più opportune per ottenere un prodotto che presenti le qualità desiderate. Questo obiettivo nasce dalla necessità, in ambito manifatturiero-industriale, di rendere maggiormente efficienti le metodologie utilizzate per il trasferimento di prodotto tra diverse apparecchiature (come nel caso dello scale-up). Ciò è di particolare interesse nel caso dello sviluppo di un nuovo prodotto, per diminuire i tempi che intercorrono
dall''approvazione in fase di laboratorio, alla produzione su scala industriale, e quindi
accelerarne l''immissione sul mercato.
Quest''analisi è stata applicata ad un processo di produzione di nanoparticelle polimeriche
mediante precipitazione con solvente, con l''utilizzo di diverse tipologie di mixer statici di
scala millimetrica. L''obiettivo del processo è quello di ottenere particelle che presentino una dimensione inferiore ad una certa soglia, per l''utilizzo in applicazioni farmaceutiche, come carrier di un principio attivo. A questo proposito erano disponibili dati storici da esperimenti effettuati sul processo in apparecchiature di diversa forma e scala, con diversi tipi di polimeri e a condizioni operative diverse.
I modelli costruiti sui dati, con l''utilizzo di tecniche di analisi statistica multivariata, hanno
dimostrato l''efficacia di queste tecniche nel ricavare le relazioni tra le condizioni di processo e la dimensione delle particelle, e hanno permesso di confermare e chiarire alcune delle relazioni già proposte in letteratura (Lince et al. 2011). In particolare si è osservato come le variabili maggiormente influenti sulla dimensione delle particelle siano diverse considerando i
dati dei due tipi di polimeri utilizzati, cioè l''omopolimero poli-ε-caprolattone (PCL) e il copolimero poli(MePEGCA-co-HDCA) (PEG). Inoltre i modelli costruiti per i dati dei due polimeri, presi separatamente, hanno dimostrato prestazioni migliori per il polimero PCL, in quanto le relazioni tra le variabili si presentano più chiare e la capacità di predizione della dimensione delle particelle è migliore, ovvero entro i limiti accettati sperimentalmente (20% per PCL rispetto al 30% per PEG). Per il copolimero PEG si è osservato come la dimensione delle particelle sia particolarmente influenzata dalla geometria del sistema; infatti
all''aumentare del diametro d''ingresso e della camera di mixing dei miscelatori, si ottengono in generale particelle a diametro maggiore. A seguire, sono il raffreddamento e la concentrazione di olio che si dimostrano particolarmente influenti sulla dimensione della particelle. Per le particelle ottenute con il polimero PCL invece, risultano più importanti le variabili che rappresentano la concentrazione e il tipo di polimero (in base al peso

molecolare), e in generale si ottengono particelle di dimensione minore con l''uso di una minore quantità di polimero, in particolare del PCL80. Si è rilevato anche che alcune variabili, come il rapporto non solvente-solvente, non presentano una grande influenza sulle particelle ottenute, in particolare per il polimero PCL. Inoltre la portata agli ingressi influenza in modo meno marcato di altre variabili la dimensione della particelle, soprattutto nel caso PEG, mentre si dimostra una variabile importante per il polimero PCL. In ogni caso una maggiore portata agli ingressi favorisce condizioni di miscelazione migliore e quindi particelle a diametro minore, in quanto aumenta la turbolenza nella camera di mixing.
Il vantaggio principale nell''utilizzo di questi modelli è stato anche la possibilità di rilevare le differenze fra i vari sistemi e i materiali utilizzati. Infatti si è osservato che, in particolare per il miscelatore a dimensioni maggiori, le variabili presentano andamenti diversi e a volte opposti rispetto a quelli degli altri miscelatori. Infine, in base ai risultati ottenuti, il campo di analisi è stato ristretto allo studio di dati ottenuti per due apparecchiature di interesse a diversa scala (i miscelatori a getti collidenti confinati CIJM-d1 e CIJM-d2) e con l''impiego del polimero PCL. Il modello ottenuto da questi dati si è dimostrato particolarmente efficiente nel rappresentare le relazioni tra le variabili di processo e la dimensione delle particelle; infatti esso presenta un errore in
predizione del 20% per l''apparecchiatura a scala minore, e del 10% rispetto a quella di scala maggiore, e una varianza spiegata per la matrice X e la risposta y particolarmente alte rispetto agli altri modelli (intorno al 50 % per la prima e al 70% per la seconda).
Questo modello è stato pertanto scelto per l''applicazione di tecniche di inversione di modello, per effettuare il trasferimento di prodotto tra le due apparecchiature considerate nel modello. La validità delle tecniche implementate è stata verificata con successo attraverso diverse prove nelle quali si sono stimate le condizioni operative per ottenere un prodotto di riferimento nell'apparecchiatura target (CIJM-d2), nella quale la disponibilità di dati storici è
limitata, sfruttando gli esperimenti effettuati sull''apparecchiatura (CIJM-d1). Le condizioni operative calcolate sono uguali a quelle attese per due delle quattro variabili determinate, ovvero per la concentrazione e il tipo di polimero, mentre la portata presenta un errore rispetto alla deviazione standard del 13%. Solo il rapporto non solvente/solvente presenta un errore maggiore, ma tale variabile si è dimostrata poco influente sulla dimensione delle nanoparticelle, per cui tale errore risulta accettabile. La metodologia proposta per il trasferimento è stata inoltre utilizzata per verificare e confermare il concetto di spazio nullo. Sono stati individuati sette diversi set di variabili di processo, ricavati con il metodo di inversione di modello per una delle due apparecchiature dai punti dello spazio nullo identificato. La verifica sperimentale di queste condizioni operative ha permesso di ottenere, in quasi tutti i casi, una dimensione delle particelle simile a quella desiderata, con un errore massimo inferiore al 15%, che è del tutto accettabile dagli sperimentatori. In tal modo è stato verificato che condizioni diverse di processo calcolate dallo spazio nullo portano alla stessa dimensione desiderata delle particelle, permettendo così di validare il concetto stesso di spazio nullo.
Risultati ancora più soddisfacenti sono stati ottenuti dall''applicazione dell''inversione del
modello nel caso il trasferimento sia effettuato con l''obiettivo di ottenere particelle di diametro inferiore a 200 o 250 nm: in questo caso, l''errore massimo tra i valori calcolati e la convalida sperimentale è stato del 5%. La procedura utilizzata ha messo però in luce alcune difficoltà nel trattare i dati sperimentali a causa delle difficile riproducibilità degli esperimenti. ' stata infatti rilevata una certa differenza fra le diverse campagne sperimentali effettuate, che è stata quantificata e considerata nella valutazione dei risultati ottenuti.
In base a questi ultimi, è auspicabile un'' applicazione futura di tali tecniche considerando non
un''unica variabile risposta come in questo caso, ma diverse caratteristiche del prodotto (per esempio il potenziale zeta, relativo alla carica superficiale delle particelle). Inoltre sarebbe opportuno sviluppare una metodologia robusta per trattare i problemi riscontrati in fase di convalida sperimentale dei dati. Ulteriori sviluppi riguardano la possibilità di applicare il metodo di inversione utilizzato, per trasferire il prodotto su altre apparecchiature o utilizzando altri materiali di cui si hanno a disposizione i dati, anche se strutturalmente meno regolari, e di rifinire i modelli creati
attraverso l''introduzione di nuove variabili, come numeri adimensionali o combinazioni delle variabili di processo, per migliorare la capacità di rappresentazione del processo in esame, e quindi la capacità di stima di nuove condizioni operative. Nomenclatura a = componente principale generica / pedice di identificazione apparecchiatura (-) A = numero di componenti principali o di variabili latenti / rango della matrice X /simbolo di identificazione apparecchiatura (-) b = pedice di identificazione apparecchiatura (-) bi = valore imposto per ogni i-esima variabile di ydes come vincolo di disuguaglianza B = simbolo di identificazione apparecchiatura (-) ba = vettore dei coefficienti di regressione per ogni componente a in un modello PLS generico (-) c = termine noto dell''equazione dell''ellisse di confidenza ci = valore imposto per ogni i-esima variabile di xnew come vincolo di uguaglianza Cpol = variabile che identifica la concentrazione di polimero nella soluzione alimentata al miscelatore Colio = variabile che identifica concentrazione di olio nella soluzione alimentata al miscelatore CIJM-d1 = miscelatore a getti collidenti confinati con d = 1 mm e D = 4.8 mm CIJM-d2 = miscelatore a getti collidenti confinati con d = 2 mm e D = 4.8 mm CIJM-SD = miscelatore a getti collidenti confinati con d = 1 mm e D = 2.4 mm CIJM-SU = miscelatore a getti collidenti confinati con d = 2 mm e D = 9.6 mm cov(X) = covarianza della matrice X d = diametro dei tubi d''ingresso al miscelatore di = valore imposto per ogni i-esima variabile di xnew come vincolo di disuguaglianza D = diametro della camera di mixing Dist = distanza tra gli ingressi alla camera del miscelatore lungo il diametro di questa eA = vettore della matrice dei residui per un dato campione E = matrice dei residui della matrice X F = matrice dei residui della matrice Y  , 1 , ' n A F = distribuzione statistica F FR = portata agli ingressi del miscelatore Fobn = funzione obiettivo di tipo n g1 = peso dato al vincolo di tipo soft su T 2 di Hotelling nella funzione di minimizzazione per il problema di inversione g2 = peso dato al vincolo di tipo soft su SPExnew nella funzione di minimizzazione per il problema di inversione g3 = peso dato al vincolo di tipo hard su SPExnew nella funzione di minimizzazione per il problema di inversione G = matrice diagonale che determina i pesi dati ad ogni componente di ydes G2 = matrice giacitura dello spazio nullo H = iperpiano che rappresenta lo spazio nullo h0 = coefficiente in f( k ' ) dell''equazione di Jackson-Mudholkar i = pedice generico J = pedice identificativo di una matrice di tipo joint j = pedice generico k = rango della matrice Y 1 = indice dell''iterazione nel metodo jackknife lbi x = valore del vincolo di tipo fisico inferiore per l''i-esima variabile del vettore x new lbi y = valore del vincolo di tipo fisico inferiore per l''i-esima variabile del vettore y des m = numero di colonne della matrice X Ma = matrice di rango unitario ottenuta dalla decomposizione della matrice X n = numero di righe della matrice X o della matrice Y pa = vettore dei loadings della matrice X per l''a-esima componente principale P = matrice dei loadings della matrice X PCi = componente principale i-esima PCL = identifica il polimero poli(MePEGCA-co-HDCA) PCL14 = identifica il polimero poli(MePEGCA-co-HDCA) a pm = 14 000 g/mol PCL80 = identifica il polimero poli(MePEGCA-co-HDCA) a pm = 80 000 g/mol PEG = identifica il copolimero poli(MePEGCA-co-HDCA) qa = vettore dei loadings della matrice Y per l''a-esima componente principale Q = matrice dei loadings della matrice Y QJ = matrice dei loadings della matrice YJ Q = squared prediction error Quench = variabile binaria che identifica la presenza o meno di raffreddamento ri = numero di righe della matrice i-esima Rew = numero di Reynolds calcolato per la corrente di acqua Rea = numero di Reynolds calcolato per la corrente di acetone Revol = numero di Reynolds calcolato per la miscela all''interno della camera di mixing 2 X pv R = varianza spiegata per variabile della matrice X 2 y pv R = varianza spiegata per variabile del vettore y sa 2 = varianza spiegata per l''a-esima colonna della matrice T Sl = matrice di covarianza calcolata dalla matrice Tnull,l per ognuna della n stime
dell''l-esimo punto dello spazio nullo Solvent = variabile binaria che identifica il tipo di solvente utilizzato ta = vettore degli scores della matrice X per l''a-esima componente principale T = matrice degli scores della matrice X Tnull = matrice degli scores dello spazio nullo ottenuta con il metodo jackknife Tnew = matrice degli scores ottenuti dall''inversione di modello con il metodo jackknife T 2 = T 2 di Hotelling T-d1 = miscelatore a T con d = 1 mm e D = 2 mm T-d2 = miscelatore a T con d = 2 mm e D = 2 mm Typepol = variabile binaria che identifica il tipo di polimero utilizzato ua = vettore degli scores della matrice Y per l''a-esima componente principale U = matrice degli scores della matrice Y ubi x = valore del vincolo di tipo fisico superiore per l''i-esima variabile del vettore x new ubi y = valore del vincolo di tipo fisico superiore per l''i-esima variabile del vettore y des vi = variabile i-esima di un generico set di dati x = riga i-esima della matrice X X = generica matrice delle variabili di processo new x' = vettore delle variabili di processo soluzione del problema di inversione di modello xnull = vettore delle soluzioni dell''inversione di modello appartenente allo spazio nullo ADIM PLS PEG, X = matrice delle variabili di processo contenente i dati del polimero PEG e in cui sono inserite delle variabili adimensionali come rapporto tra concentrazioni o diametri 1 CIJMd PCL X = matrice delle variabili di processo in cui sono considerati i dati del polimero
PCL ottenuti con l''apparecchiatura CIJM-d1 fatt CIJMd PCL 3 , 1 X = matrice delle variabili di processo in cui sono considerati i dati del polimero
PCL ottenuti con l''apparecchiatura CIJM-d1 e sono inserite le variabili ottenute dai prodotti di due variabili di processo fatt 2,3 CIJMd
PCL X = matrice delle variabili di processo in cui sono considerati i dati del polimero PCL ottenuti con l''apparecchiatura CIJM-d21 e sono inserite le variabili ottenute dai prodotti di due variabili di processo 1 CIJMd PEG X = matrice delle variabili di processo in cui sono considerati i dati del polimero
PEG ottenuti con l''apparecchiatura CIJM-d1 2 CIJMd PEG X = matrice delle variabili di processo in cui sono considerati i dati del polimero
PEG ottenuti con l''apparecchiatura CIJM-d2 CIJMSU PEG X = matrice delle variabili di processo in cui sono considerati i dati del polimero
PEG ottenuti con l''apparecchiatura CIJM-SU CONF PEG X = matrice delle variabili di processo in cui sono considerati i dati del polimero PEG e sono inserite le variabili che rappresentano le configurazioni 2 , FATT PLS PCL X = matrice delle variabili di processo in cui sono considerati i dati del polimero PCL e sono inserite le variabili ottenute dai prodotti di due variabili di processo 3 , FATT PLS PCL X = matrice delle variabili di processo in cui sono considerati i dati del polimero PCL e sono inserite le variabili ottenute dai prodotti di tre variabili di processo noQUENCH PEG X = matrice delle variabili di processo in cui sono considerati i dati del polimero PEG ottenuti in assenza di raffreddamento PCA PCL X = matrice che comprende sia le variabili di processo che la variabile risposta, in cui sono considerati i dati del polimero PEG PCA PEG X = matrice che comprende sia le variabili di processo che la variabile risposta, in cui sono considerati i dati del polimero PEG QUENCH PEG X = matrice delle variabili di processo in cui sono considerati i dati del polimero PEG ottenuti in presenza di raffreddamento Re PCL X = matrice delle variabili di processo contenente i dati del polimero PCL e in cui sono inserite delle variabili adimensionali del numero di Reynolds TOT PCL X = matrice delle variabili di processo in cui sono considerati i dati del polimero PCL TOT PEG X = matrice delle variabili di processo in cui sono considerati i dati del polimero PEG wawa PEG X = matrice delle variabili di processo in cui sono considerati i dati del polimero
PEG ottenuti con l''apparecchiatura w-a-w-a y = riga i-esima della matrice Y Y = generica matrice delle variabili di processo YJ = matrice delle variabili di processo di tipo joint ŷ new = vettore delle variabili risposta che corrisponde alla soluzione del problema di inversione di modello ydes = vettore delle variabili risposta desiderate ADIM PLS PEG, y = vettore della variabile risposta relativo alla matrice ADIM PLS PEG, X 1 CIJMd PCL y = vettore della variabile risposta relativo alla matrice 1 CIJMd PCL X fatt CIJMd JYPLS 3 , 1 y = vettore della variabile risposta relativo alla matrice fatt CIJMd PCL 3 , 1 X fatt CIJMd JYPLS 3 , 2 y = vettore della variabile risposta relativo alla matrice fatt CIJMd PCL 3 , 2 X 1 CIJMd PEG y = vettore della variabile risposta relativo alla matrice 1 CIJMd PEG X 2 CIJMd PEG y = vettore della variabile risposta relativo alla matrice 2 CIJMd PEG X CIJMSU PEG y = vettore della variabile risposta relativo alla matrice CIJMSU PEG X CONF PEG y = vettore della variabile risposta relativo alla matrice CONF PEG X 2 , FATT PLS PCL y = vettore della variabile risposta relativo alla matrice 2 , FATT PLS PCL X 3 , FATT PLS PCL y = vettore della variabile risposta relativo alla matrice 3 , FATT PLS PCL X noQUENCH PEG y = vettore della variabile risposta relativo alla matrice noQUENCH PEG X QUENCH PEG y = vettore della variabile risposta relativo alla matrice Re PCL X Re PCL y = vettore della variabile risposta relativo alla matrice QUENCH PEG X TOT PCL y = vettore della variabile risposta relativo alla matrice TOT PCL X TOT PEG y = vettore della variabile risposta relativo alla matrice TOT PEG X wawa PEG y = vettore della variabile risposta relativo alla matrice TOT PEG X wa = vettore dei weights della matrice X per l''a-esima componente principale W = matrice dei weights della matrice X W/A = variabile che identifica il rapporto non solvente/solvente w-a-w-a = miscelatore a vortice a 4 ingressi, con d = 1 mm e D = 4 mm, Dist =2 mm w-w-a-a = miscelatore a vortice a 4 ingressi, con d = 1 mm e D = 4 mm, Dist =4 mm w-a = miscelatore a vortice a 2 ingressi, con d = 1 mm e D = 4 mm, Dist =4 mm  z = 100'(1-α) percentile della distribuzione normale Lettere greche
α = grado di confidenza ij  = delta di Kronecker k ' = coefficiente in f( i  ) dell''equazione di Jackson-Mudholkar ρ = densità μ = viscosità ν = velocità λ i = auto valore associato all''i-esimo vettore p i λ null = serie di valori arbitrari per la costruzione dello spazio nullo
Acronimi PCA = principal component analysis PLS = partial least squares RMSEC = root mean square error of calibration RMSECV = root mean square error cross validation RMSEP = root mean square error of prediction SPE = squared prediction error SVD = singular value decomposition STD = standard deviation THF = Tetrahydrofuran JY-PLS = Joint-Y partial least squares VIP = variable importance in projection Appendice Codici di calcolo In Appendice viene riportato l''elenco dei codici di calcolo utilizzati nella Tesi che sono raccolti nella cartella tesiMeneghetti\Codici\. Tabella A.1. Codici di calcolo utilizzati nel Capitolo 3 per la costruzione di
modelli PCA e PLS basati sia su tutti i dati a disposizione del copolimero
PEG, sia sui dati di alcune apparecchiature prese singolarmente. Codici di calcolo Dati Risultati PCA_PEG_tot.m XeyPEG_tot.mat Ris_ PCA_PEG_tot.mat PCA_PEG_CIJM-d1.m XeyPEG_CIJM-d1.mat Ris_PCA_PEG_CIJM-d1.mat PCA_PEG_CIJM-d2.m XeyPEG_CIJM-d2.mat Ris_ PCA_PEG_CIJM-d2.mat PCA_PEG_CIJM-SU.m XeyPEG_CIJM-SU.mat Ris_ PCA_PEG_CIJM-SU.mat PCA_PEG_wawa.m XeyPEG_wawa.mat Ris_ PCA_PEG_wawa.mat PLS_PEG_tot.m XeyPEG_tot.mat Ris_ PLS_PEG_tot.mat PLS_PEG_CIJM-d1.m XeyPEG_CIJM-d1.mat Ris_ PLS_PEG_CIJM-d1.mat PLS_PEG_CIJM-d2.m XeyPEG_CIJM-d2.mat Ris_ PLS_PEG_CIJM-d2.mat PLS_PEG_CIJM-SU.m XeyPEG_CIJM-SU.mat Ris_ PLS_PEG_CIJM-SU.mat PLS_PEG_wawa.m XeyPEG_wawa.mat Ris_ PLS_PEG_wawa.mat Tabella A.2. Codici di calcolo utilizzati nel Capitolo 3 per la costruzione di
modelli PCA e PLS basati sia su tutti i dati a disposizione del copolimero
PCL, sia sui dati dell''apparecchiatura CIJM-d1. Codici di calcolo Dati Risultati PCA_PCL_tot.m XeyPCL_tot.mat Ris_ PCA_PCL_tot.mat PCA_PCL_CIJM-d1.m XeyPCL_CIJM-d1.mat Ris_ PCA_PCL_CIJM-d1.mat PLS_PCL_tot.m XeyPCL_tot.mat Ris_ PLS_PCL_tot.mat PLS_PCL_CIJM-d1.m XeyPCL_CIJM-d1.mat Ris_ PLS_PCL_CIJM-d1.mat Tabella A.3. Codici di calcolo utilizzati nel Capitolo 3, per la costruzione di
modelli PCA e PLS introducendo nelle matrici dei dati del polimero PEG e
PCL variabili che rappresentano il tipo di configurazione o ottenute come
combinazione delle variabili manipolabili. Codici di calcolo Dati Risultati PCA_PEG_configuraz.m XeyPEG_configuraz.mat Ris_ PCA_PEG_configuraz.mat PLS_PCL_Re.m XeyPCL_Re.mat Ris_ PLS_PCL_Re.mat PCA_PEG_adim.m XeyPEG_adim.mat Ris_ PCA_PEG_adim.mat PLS_PCL_2fatt.m XeyPCL_2fatt.mat Ris_ PLS_PCL_2fatt.mat PLS_PCL_3fatt.m XeyPCL_3fatt.mat Ris_ PLS_PCL_3fatt.mat Tabella A.4. Codici di calcolo utilizzati nel Capitolo 3 per comprendere
l''influenza del raffreddamento sulle altre variabili manipolabili e sulla
dimensione delle particelle. Codici di calcolo Dati Risultati PLS_PEG_noquench.m XeyPEG_noquench.mat Ris_ PLS_PEG_noquench.mat PLS_PEG_quench.m XeyPEG_quench.mat Ris_ PLS_PEG_quench.mat Tabella A.5. Codici di calcolo utilizzati nel Capitolo 4 per la costruzione di
modelli JY-PLS in cui si considerano i dati di tutte le apparecchiature e i
polimeri a disposizione o solo i dati del polimero PCL. Codici di calcolo Dati Risultati JYPLS_tot.m XeyJYPLS_tot.mat Ris_ JYPLS_tot.mat JYPLS_PCL.m XeyPCL_tot.mat Ris_ JYPLS_PCL.mat JYPLS_PCL_CIJMd1d2.m XeyCIJMd1d2.mat Ris_ JYPLS_PCL_CIJMd1d2.mat Tabella A.6. Codici di calcolo utilizzati nel Capitolo 5 per affrontare il
problema di trasferimento di prodotto tra le apparecchiature CIJM-d1 e
CIJM-d2. Questi risultati sono utili per testare la tecnica applicata, al
variare del numero di variabili latenti considerate, o al variare del numero
di campioni selezionati nelle matrici su cui si costruisce il modello JY-PLS
da invertire Codici di calcolo Dati Risultati INV_LV.m XeyCIJMd1d2_INV_1.mat XdesCIJMd1d2_INV_1.mat ydesCIJMd1d2_INV_1.mat Ris_ INV_LV2.mat Ris_ INV_LV3.mat Ris_ INV_LV4.mat INV_rand.m XeyCIJMd1d2_INV_1.mat XdesCIJMd1d2_INV_1.mat ydesCIJMd1d2_INV_1.mat Ris_ INV_rand10.mat Ris_ INV_rand20.mat Ris_ INV_rand30.mat Ris_ INV_rand40.mat Ris_ INV_rand50.mat Ris_ INV_rand60.mat Ris_ INV_rand70.mat Ris_ INV_rand80.mat INV_dottimale.m XeyCIJMd1d2_INV_1.mat XdesCIJMd1d2_INV_1.mat ydesCIJMd1d2_INV_1.mat Ris_ INV_dottimale10.mat Ris_ INV_dottimale20.mat Ris_ INV_dottimale30.mat Ris_ INV_dottimale40.mat Ris_ INV_dottimale50.mat Ris_ INV_dottimale60.mat Ris_ INV_dottimale70.mat Ris_ INV_dottimale80.mat Ris_ INV_dottimale90.mat Tabella A.7. Codici di calcolo utilizzati nel Capitolo 5 per affrontare il
problema di trasferimento di prodotto tra le apparecchiature CIJM-d1 e
CIJM-d2. Applicazione di diversi scenari, con l''imposizione o meno del tipo
di polimero. Codici di calcolo Dati Risultati INV_scenario2.m XeyCIJMd1d2_INV_2.mat XdesCIJMd1d2_INV_2.mat ydesCIJMd1d2_INV_2.mat Ris_ INV_sc2_nopol.mat Ris_ INV_sc2_conpol.mat INV_scenario3.m XeyCIJMd1d2_INV_2.mat XdesCIJMd1d2_INV_2.mat ydesCIJMd1d2_INV_2.mat Ris_ INV_sc3_nopol.mat Ris_ INV_sc3_200_1.mat Ris_ INV_sc3_200_2.mat Ris_ INV_sc3_250_3.mat Tabella A.8. Codici di calcolo utilizzati nel Capitolo 5 per affrontare il
problema di trasferimento di prodotto tra le apparecchiature CIJM-d1 e
CIJM-d2, in particolare per la verifica dello spazio nullo, sia mono che
bidimensionale, e per il calcolo dei relativi limiti. INV_sc2_nullspace.m XeyCIJMd1d2_INV_2.mat XdesCIJMd1d2_INV_2.mat ydesCIJMd1d2_INV_2.mat Ris_ INV_sc2_nullspace1.mat Ris_ INV_sc2_nullspace2.mat Ris_ INV_sc2_nullspace3.mat Ris_ INV_sc2_nullspace4.mat Ris_ INV_sc2_nullspace5.mat Ris_ INV_sc2_nullspace6.mat INV_spazionullomono.m XeyCIJMd1d2_INV_2.mat XdesCIJMd1d2_INV_2.mat ydesCIJMd1d2_INV_2.mat Ris_INV_nullspacemono1.mat Ris_INV_nullspacemono2.mat Ris_INV_nullspacemono3.mat Ris_INV_nullspacemono4.mat INV_spazionullobid.m XeyCIJMd1d2_INV_2.mat XdesCIJMd1d2_INV_2.mat ydesCIJMd1d2_INV_2.mat Ris_ INV_spazionullobid1.mat Ris_ INV_spazionullobid2.mat Ris_ INV_spazionullobid3.mat Ris_ INV_spazionullobid4.mat Ris_ INV_spazionullobid5.mat Ris_ INV_spazionullobid6.mat INV_limiti_nullspace.m XeyCIJMd1d2_INV_2.mat XdesCIJMd1d2_INV_2.mat ydesCIJMd1d2_INV_2.mat Ris_ INV_limiti_nullspace.mat Riferimenti bibliografici Chong, I.-G., C-H. Jun (2005). Performance of some variable selection methods when multicollinearity is present. Chemom. Intell. Lab. Syst., 78, 103-112. de Aguiar, P. F., B. Bourguignon, M. S. Khots, D.L. Massarat, R. Phan-Than-Luu (1995). D- optimal design. Chemom. Intell. Lab. Syst., 30, 199-210. Duchesne, C., J. F. MacGregor (2001). Jackknife and bootstrap methods in the identification of dynamic models. J. Proc. Cont., 11, 553. Eriksson, E., E. Johansson, (2001). Multi and Megavariate Data Analysis: Principles and Applications. Umetrics AB., Umea (Sweden). Garcìa-Muñoz, S., J. F. MacGregor, T. Kourti (2005). Product transfer between sites using Joint-Y PLS. Chemom. Intell. Lab. Syst., 79, 101-114. Garcìa-Muñoz, S., T. Kourti, J. F. MacGregor, F. Apruzzese, M. Champagne (2006). Optimization of batch operating policies. Part I. Handling multiple solutions. Ind. Eng. Chem. Res., 45, 7856. Garcìa-Muñoz, S., J. F. MacGregor, D. Neogi, B. E. Letshaw, S. Metha (2008). Optimization of batch operating processes. Part II. Incorporating process constraints and industrial applications. Ind. Eng. Chem. Res., 47, 4202. Garcìa-Muñoz, S. (2009). Establishing multivariate specifications for incoming materials using data coming from multiple scales. Chemom. Intell. Lab. Syst., 98, 51. Geladi, P., B. Kowalski, (1986). Partial least squares: a tutorial. Anal. Chim. Acta, 185, 1-17. Horn, D., J. Rieger (2001). Organic nanoparticles in the aqueous phase-theory, experiment, and use. Angew. Chem. Int. Ed., 40, 4330-4361. Jaeckle, C. M., J. F. MacGregor (1998). Product design through multivariate statistical analysis of process data. AIChE J., 44, 1105-1118. Jaeckle, C. M., J. F. MacGregor (2000). Industrial application of product design through the inversion of latent variable models. Chemom. Intell. Lab. Syst., 50, 199-210. Jaeckle, C. M., J. F. MacGregor (2000). Product Transfer between plants using historical process data. AIChE J., 46, 1989-1997. Jones, R. A. L. (2002) Soft condensed Matter. Oxford University Press Inc., New York (U.S.A.). Kourti, T., J. MacGregor (1994). Process analysis monitoring diagnostic, using multivariate projection methods. Chemom. Intell. Lab. Syst., 28, 3-21. Lince, F., D. L. Marchisio, A. A. Barresi (2008). Strategies to control the particle size distribution of poly -ε-caprolactone nanoparticles for pharmaceutical applications. J. Colloid Interface Sci., 322, 505-515.
Lince, F., S. Bolognesi, D. L. Marchisio, B. Stella, F. Dosio, A. A. Barresi, L. Cattel (2011). Preparation of Poly(MePEGCA-co-HDCA) nanoparticles with confined impinging jets reactor: experimental and modeling study. J. of Pharm. Sci., 100, 2391-2405. Lince, F., D. L. Marchisio, A. A. Barresi (2011). A comparative study for nanoaparticle production with passive mixers via solvent displacement: Use of CFD models for optimization and design. Chem. Eng. Proc., 50, 356-368. Liu , Z., M. -J. Bruwer, J. F. MacGregor, S. S. S. Rathore, D. E. Reed, M. J. Champagne (2011). Scale-Up of a pharmaceutical roller compaction process using a Joint-Y partial least squares model. Ind. Eng. Chem. Res., 50, 10696-10706. Lu, J., F. Gao, (2008). Model migration with inclusive similarity for development of a new process model. Ind. Eng. Chem. Res., 47, 9508-9516. Mersmann, A. (1999) Crystallization and precipitation. Chem. Eng. Proc., 38, 345-353. Muteki, K., K. Yamamoto, G. L. Reid, M. Krishnan (2011). De-risking scale-up of a high- shear wt granulation process using latent variable modeling and near-infrared spectroscopy. J. Pharm. Innov., 6, 142. Tomba, E., M. Barolo, S. Garcìa- Muñoz (2012). A general framework for latent variable model inversion to support product and process design. 22 nd European Symposium on Computer Aided Process Engineering, 30, 512-516. Valente, I., E. Celasco, D. L. Marchisio, A. A. Barresi (2012). Nanoprecipitation in confined impinging jet mixers: Production, characterization and scale-up of pegylated nanospheres and nanocapsules for pharmaceutical use. Chem. Eng. Sci., 77, 217-227. Valente, I., B. Stella, D. L. Marchisio, F. Dosio, A. A. Barresi (2012). Production og PEGylated nanocapsules through solvent displacement in confined impinging jet mixers. J. of Pharm. Sci., 101, 2490-2501. Wise, B. M., N. B. Gallagher (1996). The process chemiometrics approach to process monitoring and fault detection. J. Proc. Cont., 6, 329-348. Wise, B., N. Gallagher, R. Bro, J. Shaver, W. Winding , R. Koch (2006). Chemometrics Tutorial for PLS_Toolbox and Solo. Eigenvector Research, Wenatchee, WA (U.S.A.). Ringraziamenti Si ringraziano per la gentile collaborazione offertaci, il Prof. Antonello Barresi e il Prof. Daniele Marchisio del Dipartimento Scienza Applicata e Tecnologia del Politecnico di Torino, per aver condiviso i dati e le conoscenze sul processo di produzione di nanoaprticelle studiato. Inoltre si ringrazia la Dott.ssa Tereza Zalenko per aver effettuato le prove sperimentali richieste.


© Eiom - All rights Reserved     P.IVA 00850640186