`Schätzung des Verteilungfkoeffizienten mit Hilfe
`quantenchemischer Molekülgrößen
`O.-E. S c h u l t z , C. J u n g und K.-E. M ö l l e r
`Pharmazeutisches Institut der Universität Kiel
`(Z. Naturforsch. 25 b, 1024— 1026 [1970] ; eingegangen am 16. März 1970)
`Wir konnten die Wirksamkeit (logl/C ; C = Hemmkonzentration) von Arylaminen gegenüber
`Bacillus aerogenes und Pseudomonas aeruginosa mit Hilfe quantenchemischer Molekülgrößen (Pi-
`Elektronenladung, Sigma-Nettoladung, Freie Valenz, Selbstatompolarisierbarkeit, Superdelokalisier-
`barkeit und 1/Deleny) über besondere statistische Methoden (kanonische Variablen) mit einer Ap­
`proximationsgüte von 98% bestimmen x. Es war außerdem möglich, auch den Verteilungskoeffizien­
`ten P bzw. log P selbst, eine wichtige Größe der HANSCHsdien o o n -Analyse 2> 3, an der gleichen
`Verbindungsreihe sehr gut quantitativ zu schätzen.
`Bei der Zielsetzung, den von H a n s c h für S truk­
`tur-W irkungsbeziehungen verwendeten V erteilungs­
`koeffizienten durch andere rechnerisch erm ittelbare
`Einflußgrößen zu ersetzen, übernahm en w ir bei
`unserer Untersuchung die von H a n s c h erm ittelten
`W erte für P (P = _ ^ 0ctLano1
`. Cq^ = Konzentra-
`^H2 0‘(l - a)
`tion in der Octanolphase, Ch20 = Konz, in H 20 ,
`a = Dissoziations-Konstante) als Zielgröße.
`Bei der Auffindung von Einflußgrößen erwies sich
`auch hier wiederum die H ü c k e 1 - M olekülorbital
`(HMO) -Methode als sehr erfolgreich. Die HMO-
`Berechnungen gehören zu den halbtheoretischen V er­
`fahren zur Lösung der S c h r ö d i n g e r - Glei­
`Da sich für größere Moleküle mit vielen Elektro­
`nen strenge Lösungen der Gleichung bisher nicht an­
`geben lassen, mußten m ehrere Vereinfachungen in
`die Berechnung eingeführt w erden9. Das LCAO-
`in der N äherung nach H ü e k e l
`M O-Verfahren
`w urde zunächst für die Berechnung der n-Elektro-
`nenverteilung in konjugierten organischen Molekülen
`ausgearbeitet. Es eignet sich jedoch auch für Diskus­
`sionen von o-Elektronensystemen bzw. gemischten
`rr/a-Systemen und liefert trotz gewisser inhärenter
`Schwierigkeiten heuristisch nützliche Ergebnisse. Die
`Sigma-Anteile der V erbindungen wurden bei unseren
`Pi-Berechnungen dadurch berücksichtigt, daß wir
`auch den aliphatischen Verbindungsteilen rein for­
`mal Pi-Elektronen zugeordnet haben, deren anders­
`artigen Verhältnissen durch besondere Param eter
`für die C o u l o m b - und Resonanzintegrale Rech­
`nung getragen wurde. Die an Stickstoff und Sauer­
`stoff sowie einzelne an Kohlenstoff gebundene H-
`Atome wurden vernachlässigt. H 2- und H3-Gruppen
`gingen als „atom are“ Einheiten m it 1 Pi-Elektron
`über Doppel- bzw. D reifachbindungen an C gebun­
`E S A P rr E S D r E n - Q r
`-f | <r - N L r |
`EFVr E I n - N L r | E | o — N L r |
`£ | 71 - N L r |
`+ ! o - N L r \
`E tz — Qr
`Z SA P rr
`E S D r
`E n —Qr
`+ \ o - N L r \
`E\F V r\
`E \ 71 —N L r I
`E \ o - N L r \
`E \ n - N L r \
`+ \ o - N L r \
`E n — Qr
`- 0 ,0 7
`- 0,03
`- 0 ,0 7
`- 0,18
`- 0,15
`2 S A P r Summe der Selbstatompolarisierbarkeiten *. 2 SDr Summe der Superdelokalisierbarkeiten *. 2 n-Qr+ \ o-N Lr \
`Summe aller Pi-Ladungen und Sigma-Nettoladungen. 2 \ F Vr | Summe der Freien Valenzen*. 2 \ zi-N Lr | Summe der
`Absolutbeträge der Pi-Nettoladungen *. 2 j o-N Lr | Summe der Absolutbeträge der Sigma-Nettoladungen**. 2 \ti-N Lr \-\-
`| o-N Lr [ Summe der Absolutbeträge der Pi- und Sigma-Nettoladungen***. 2 n-Qr Summe der Pi-Ladungen*. Die
`Summen der betreffenden Einzelgrößen wurden gewählt, um die Wechselwirkung aller Atome des Moleküls mit den um­
`gebenden Medien zu berücksichtigen.
`Tab. 1. Einfachkorrelationskoeff. zwischen den Variablen und log P sowie Interkorrelationskoeff. zwischen den Variablen.
`den in die Rechnung ein. Andererseits wurde die
`Sigma-Elektronen-Verteilung noch gesondert nach
`der von D e l R e erarbeiteten M ethode e rfa ß t6.
`Hierbei sind auch alle H-Atome berücksichtigt w or­
`Einige der beim U berprüfen m ehrerer Molekül-
`indices auf K orrelationen zum Logarithm us des V er­
`teilungskoeffizienten erhaltenen Ergebnisse einfacher
`linearer Regressionsanalysen zeigt die Tab. 1, die
`in M atrixform die
`zwischen den Variablen und die Einfachkorrelations-
`Koeffizienten zwischen log P und den einzelnen V a­
`riablen enthält.
`lineare Regressionen m it m ehreren
`V ariablen ergaben z. T. hohe m ultiple Bestim m t­
`heitsmaße (0,998). Bedenklich ist jedoch die hohe
`Interkorrelation, die die Größe m it einigen anderen
`V ariablen hat. Jedoch auch bei A ußerachtlassung der
`letzten Variablen wurde eine zufriedenstellend hohe
`Approxim ationsgüte
`erhalten. Die Regressionen
`ohne Berücksichtigung von 2 , z i-Q t zeigten bei der
`B a c k w a r d - Elim ination, daß auch der Regressor
`2 1 n-Q r + 1 o-N Lr | herausfiel, obwohl er in der M a­
`trix die höchste K orrelation zu lo g P aufweist. W ir
`erhielten die Regressionsgleichung:
`log P = - 3,13 + 0,54 I S A P r + 0,04 2 S D r
`+ 1 ,0 5 I \ F V r \ - 0,64 2 11 o-N L r |
`Die Approxim ationsgüte geht aus dem unteren Teil
`der Tab. 2 hervor. Sie bringt eine Übersicht der mit
`dieser Gleichung erhaltenen Ergebnisse.
`W enn auch die genannten quantenchemischen
`Größen keinen exakt definierten physikalisch-chemi­
`schen Größen direkt entsprechen, so sei doch eine
`vorsichtige Interpretation der Resultate unter phy­
`sikalisch-chemischen Gesichtspunkten gegeben.
`Bei der Verteilung eines Stoffes zwischen 2 unter­
`schiedlichen Medien spielt die enge Wechselwirkung
`(z. B. Solvatisierung, H 0 -Brücken,
`v a n
`d e r
`W a a 1 s c h e Bindungen) der Stoffmoleküle m it
`den Molekülen der Medien eine entscheidende Rolle.
`Verständlich ist, daß ein Stoff um so hydrophiler
`ist, je m ehr er hydratisiert werden kann, je m ehr
`die W asserdipole sich auf Grund der klassischen
`Ionen-Dipol-Anziehung an vorhandene Teilladungs­
`zentren anlagern können, je größer also die Summe
`der Absolutwerte der Nettoladungen ist. So ist der
`negative Koeffizient der Größe 2 | o-N Lr \ zu deu­
`Daß die Nettoladungen der Sigma-Berechnungen
`größere Bedeutung als die Pi-Nettoladungen haben,
`mag ein Hinweis darauf sein, daß gerade den H-
`Atomen (besonders den an Heteroatomen gebunde­
`nen (W asserstoffbrücke)) eine entscheidende Rolle
`bei der Verteilung zukommt.
`Die Selbstatom polarisierbarkeit hat sich bereits
`als sehr wichtige Größe beim Abschätzen von Reak­
`tivitäten organischer V erbindungen b ew äh rt9. Der
`eigentlichen chemischen Reaktion geht in den meisten
`Fällen die Bildung von lockeren A nlagerungsverbin­
`dungen voraus, deren Stabilität durchaus für die
`Reaktionsgeschwindigkeit von Bedeutung ist. Diese
`Z S A P rr
`Z S D r
`Z \F V r \ Z \ c - N L r \
`log P
`log P
`log P Schätzung
`log P Beobachtung
`c6h 5n h 2
`2 -CH3 - C 6H 4 - N H 2
`4 -CH3 - C 6H 4- N H 2
`c6h 5n c h 2h 5
`2-CH3- C 6H4-N H C H 3
`4 -CH3 - C 6H 4-N H C H 3
`C6H 5N(CH3)2
`2-CH3- C 6H 4N(CH3)2
`4-CH3—C6H4—N (CH3)2
`C6H 5(C2H5)2
`2 -CH3 —Chinolin
`1 -Naphthylamin
`Tab. 2. Übersicht über die Ergebnisse der HMO-, o- und Regressionsrechnung.
`Stichprobenumfang N : 15, F-Test: 239,6, Standardabweichung der Residuen: 0,075, Multiple B: 0,99, Korr. Koeff.: r=
`VMult! B = 0,955.
`Anlagerungskom plexe — eng verknüpft mit P ola­
`risierbarkeits-Erscheinungen beider P artner —
`ten auch bei Verteilungsprozessen auf, so daß die
`K orrelation log P — 2 S A P r durchaus verständlich
`Die Freie Valenz ist ein Maß für die noch freie
`Pi-B indungskraft. Je höher ihr W ert ist, um so grö­
`ßer ist die Bindungsmöglichkeit zu einem Reaktions­
`partner, hier zur lipophilen Phase, speziell Oktanol.
`Die Superdelokalisierbarkeit ist aus der Front-
`Elektronen-Theorie 10 entstanden. Auch diese Größe
`steht in Zusam menhang mit m ehreren Theorien, die
`auf einem „charge-transfer“-Modell für die Ü ber­
`gangszustände bei chemischen — in diesem Fall phy­
`sikalisch-chemischen — Vorgängen beruhen.
`Es sei an dieser Stelle auch erwähnt, daß R o g e r s
`und CAMMARATA an einer anderen Reihe arom ati­
`scher V erbindungen Korrelationen zwischen dem
`natürlichen Logarithm us des Verteilungskoeffizien­
`ten und der Superdelokalisierbarkeit (Summe S D r)
`sowie der Ladungsdichte (Summe der absoluten L a­
`dungsdichten) nachgewiesen haben (r = 0,978; B
`= r2 = 0,956; F-Test-W ert = 177,48) 5.
`Bei Reduzierung unserer oben genannten Regres­
`u . H . K o l l m a n n , Tetrahedron Letters
`1 O.-E. S c h u l t z
`[London] 4,263 [1970].
`2 O.-E. S c h u l t z , H . K o l l m a n n u . E. W e b e r , Arzneimittel-
`Forsch., im Drude.
`3 C. H a n s c h et al., J. Amer. chem. Soc. 85, 2817 [1963].
`4 E. L ie n , C. H a n s c h et al., J. Med. Chem. 11, 430 [1968].
`5 K . S . R o g e r s u . A. C a m m a r a t a , J. Med. Chem. 12, 692
`6 E. K r ü g e r -T h ie m e r u . R. H a n s e n , Arzneimittel-Forsch.
`16,1453 [1966].
`sionsgleichung durch weitere Elim ination entsteht
`(F-Test vgl. 1. c . 8) die noch gut approxim ierende
`log P = - 4,21 + 0,57 2 S A P r + 1,16 Z \ F V r \
`F-Test: 129,3; S-Residuen: 0,141; r = 0,98.
`Bei der von uns ausgewählten Verbindungsreihe
`biologisch aktiver Arylam ine wird mit dieser Glei­
`chung bei einem M inimum an Regressoren die
`höchste Schätzung des Regressanden erzielt.
`H ierdurch wird gezeigt, daß auch die Größen
`Z S A P r und 2 \ F V r \, deren Verwendung in der
`L iteratur noch nicht beschrieben ist, wesentliche Be­
`deutung für die Schätzung des Verteilungskoeffizien­
`ten und dam it auch für die Schätzung der W irkung
`von biologisch aktiven Stoffen haben.
`Die quantenchemischen Strukturindices wurden
`mit einem von K r ü g e r - T h ie m e r 6 entworfenen und
`von uns verfeinerten und erweiterten HMO-Pro-
`gram m
`(mit Param etern nach P u ll m a n 6> 12, die
`Sigma-Netto-Ladungen m it einem von uns nach Del
`R e 6 erstellten Program m und die Regressionen nach
`W e b e r 7’ 8 erhalten. Die Rechnungen wurden am
`Rechenzentrum der U niversität K iel durchgeführt.
`7 G. D e l Re, J. chem. Soc. [London] IV, 4031 [1958].
`8 E. W e b e r , Statistische Hefte 8, 228 [1967].
`9 E. W e b e r , Statistische Hefte 9,13 [1968].
`10 A. S t r e i t w i e s e r , Molecular Orbital Theory f. Organic
`Chemists, John Wiley, New York 1961.
`11 K . F u k u i et al., J. diem. Physics 27, 1247 [1957].
`12 A. P u l l m a n n u . B. P u l l m a n n , Quantum Biochemistry,
`Interscience Publishers, New York, London 1963.
`O.-E. Schultz C. Jung and K.-E. Möller
`Estimating the Distribution Coefficient using
`Quantum Chemical Molecular Values
`O.-E. Schultz C. Jung and K.-E. Möller
`Pharmaceutical Institute of the University of Kiel
`(Z. Naturforsch. [Journal of Natural Sciences] 25 b, 1024-1026 [1970]; received on March 16, 1970)
`We were able to determine the effectiveness (log 1/C; C = inhibitory concentration) of amines
`with respect to Bacillus aerogenes and Pseudomonas aeruginosa using quantum chemical
`molecular values (Pi-electron discharge, Sigma-net charge, free valance, self-atomic
`polarizability, super-delocalizability, and 1/Deleny) via special static methods (canonical
`variables) with an approximation quality of 98%1. Furthermore, it was also possible to make a
`good quantitative estimate of the distribution coefficients P, or log P, respectively, themselves,
`an important value for the Hansch߷ߪߨ analysis2-3, on the same series of compounds.
`we took the value determined by the Hansch analysis forܲ ( ܲ= ஼ೀ೐೟೓ೌ೙೚೗஼ಹమೀ∗(಺షഀ);ܥை೐೟.=
`With the intention of replacing the distribution coefficients used in Hansch analysis for
`structure-effect relationships with other impacting values that can be determined mathematically,
`concentration in the octanol phase, CH2O = concentration in H2O,  = dissociation constant) as
`the target value in our examination.
`For the discovery of impact values, the Hückel molecule orbital (HMO) method, in turn,
`also proved itself to be very successful. The HMO calculations belong to the half-theoretical
`method for solving the Schrödinger equation.
`Because strict solutions for the equation for larger molecules having numerous electrons
`could not be obtained so far, numerous simplifications had to be inserted in the calculation9. The
`LCAOMO method in the approximation according to Hückel was first worked out for the
`calculation of the π electron distribution in conjugated organic molecules. This is also suitable,
`however, for discussions of  electron systems, or mixed π/ systems, and delivers, despite
`inherent difficulties, heuristic usable results. The sigma portion of the compounds is taken into
`account in our pi calculations, in that we also allocated pure formal pi electrons to the aliphatic
`compound portions, the different relationships of which were supported by specific parameters
`for the Coulomb and resonance integral calculation. The hydrogen atoms bonded to nitrogen and
`oxygen, as well as individually on carbon, were ignored. H2 and H3 groups were regarded as
`“nuclear” units with 1 pi electron, bonded via double and triple bonds to C, in the calculation.
`On the other hand, the sigma electron distributions were separately determined according to the
`method created by Del Re6. Here as well, all of the H atoms were also taken into account.
`Some of the results of simple linear regression analyses, obtained when testing numerous
`molecule indices for correlations to the logarithm for distribution coefficients, are shown in
`Table 1, which contains, in matrix form, the inter-correlation coefficients between the variables
`and the simple correlation coefficients between log P and the individual variables.
`Multiple linear regressions with numerous variables resulted, in part, in high multiple
`coefficients of determination (0.998). The high inter-correlation, however, is doubtful, which
`has the value with some other variables. However, when the last variables are disregarded, a
`satisfactory level of approximation quality was obtained. The regressions without taking into
`the regression equation:
`accountΣߨ−ܳ௥ showed, with the backward elimination, that the regressorΣߨ−ܳ௥+|ߪ−
`ܰ ܮ௥| drops out, although it exhibits the highest correlation to log P in the matrix. We obtained
`logܲ=−3.13+0.54Σ ܵ ܣ ܲ௥+0.04Σ ܵ ܦ௥+1.05Σ|−ܨ ܸ௥|−0.64Σ|ߪ−ܰ ܮ௥|
`The approximation quality can be determined from the lower part of Tab. 2. It provides an
`overview of the results obtained with this equation.
`Even when the specified quantum chemical values do not directly correspond to a
`precisely defined physical chemical value, then, nevertheless, a cautious interpretation of the
`result is obtained, under physical/chemical perspectives.
`With the distribution of a substance between 2 different media, the close interaction (e.g.,
`solvation, H-bridges, van der Waal bonds) of the molecules with the molecules of the media
`plays a decisive roll. It is understandable that a substance is more hydrophilic the more it can be
`hydrated, the more the water dipole, due to the classic ion dipole attraction, can accumulate on
`existing partial charge centers, the larger the sum, therefore, of the absolute values of the net
`charge. Thus, the negative coefficient is to be interpreted as the valueΣ|ߪ−ܰ ܮ௥|.
`That the net charges of the sigma calculations are more important than the pi net charges,
`may be regarded as an indication that, specifically, the H atoms (particularly those bonded to
`hetero-atoms (hydrogen bridges)) play a decisive roll in the distribution.
`The self-atomic polarizability has already proven to be a very important factor in
`estimating the reactivities of organic componds9. The actual chemical reaction is usually
`preceded by the formation of loose accumulation compounds, the stability of which is of great
`importance for the reaction speed. These accumulation complexes – closely linked to
`polarizability appearances of both partners – also occur in distribution processes, such that the
`correlation oflogܲ−Σ ܵ ܣ ܲ௥ is clearly understandable.
`The free valence is a measure for the still free pi bond force. The higher the value, the
`greater the bonding possibility to a reactant, the lipophilic phase in this case, particularly octanol.
`The super-delocalizability is derived from the Front electron theory10. This value is also
`connected to numerous theories, which are based on a “charge-transfer” model for the
`transitional states in chemical – in this case physical/chemical – processes.
`It should also be noted at this point, that Rogers and Cammarata have proven the
`existence of correlations between the natural logarithm for the distribution coefficients and the
`super-delocalizability (sum S Dr) as well as the charge density (sum of the absolute charge
`densities) in other series of aromatic compounds (r = 0.978; B = r2 = 0.956; F-test value =
`In reducing our regression equation specified above, through further elimination, the still
`good approximating equationlogܲ=−4.21+0.57Σ ܵ ܣ ܲ௥+1.16Σ|ܨ ܸ௥|
`is obtained (F-test see I.c.8). F-test: 129.3; S-residuals: 0.141; r = 0.98.
`With the compound series we selected, biologically active amines are obtained with this
`equation with a minimum of regressors in the highest estimation of the regressing elements.
`By this means, it has been shown that the values S A Pr and |F Vr|, the use of which
`has not yet been described in the literature, also has a substantial importance for the estimation of
`the distribution coefficients and thus also for the estimation of the effect of biologically active
`The quantum chemical structure indices were obtained with an HMO program designed
`by Krüger-Thiemer6 and refined and expanded by us (with parameters according to Pullman6, 12),
`the sigma net charges were obtained with a program created by us, according to Del Re6, and the
`regressions were obtained according to Weber7, 8. The calculations were carried out in the
`computer center at the University of Kiel.
`Table 1
`S A Pr sum of the self-atomic polarizabilities*. S Dr sum of the super-delocalizabilities*. 
`π*Qr+|*N Lr| sum of all pi charges and sigma net charges. |F Vr| sum of the free valences*.
` |π*N Lr| sum of the absolute values for the pi net charges*. |*N Lr| sum of the absolute
`values for the sigma net charges**.  |π*N Lr| + |*N Lr| sum of the absolute values of the pi and
`sigma net charges***.  π-Qr sum of the pi charges*. The sums of the pertinent individual
`values are selected in order to take into account the interaction of all atoms in the molecule with
`the surrounding media.
`Table 1 Simple correlation coefficients between the values and log P, as well as inter-correlation
`coefficients between the values.
`Table 2
`Table 2. Overview of the results of the HMO-, - and regression calculation.
`Sampling size N: 15, F-test: 239.6, standard deviation of the residuals: 0.075, multiple B: 0.99,
`correlation coefficient: r =√݉ݑ݈ݐ.ܤ=0.955.
`This is to certify that the foregoing translation of the document entitled Estimating the Distribution
`Coefficient using Quantum Chemical Molecular Values was made from German to English from
`the document by a competent translator well acquainted with both languages, and that, to the best of our
`knowledge and belief, it is a true and complete rendering into English of the original document.
` DATE: 4/10/15
` Donald W. Hanley, CEO
