brentp · September 17, 2024 14:48 · dburdett · Apr 13, 2018 · saccosj · Jun 16, 2018
diff --git a/betareg.py b/betareg.py
 import numpy as np
 from scipy.special import gammaln as lgamma
 from statsmodels.base.model import GenericLikelihoodModel
 from statsmodels.api import GLM
 from statsmodels.genmod.families import Binomial

 #see http://cran.r-project.org/web/packages/betareg/vignettes/betareg-ext.pdf

 def ilogit(a):
    return 1 / (1. + np.exp(-a))

 def logit(a):
    return np.log(p / (1. - p))

 class BetaReg(GenericLikelihoodModel):
    def __init__(self, endog, exog, Z=None, **kwds):
        super(BetaReg, self).__init__(endog, exog, **kwds)
        # how to set default Z?
        if Z is None:
            self.Z = np.ones((self.endog.shape[0], 1), dtype='f')
        else:
            self.Z = np.asarray(Z)
            assert len(self.Z) == len(self.endog)

    def nloglikeobs(self, params):
        return -self._ll_br(self.endog, self.exog, self.Z, params)

    def fit(self, start_params=None, maxiter=1000000, maxfun=50000, **kwds):
        if start_params is None:
            start_params = GLM(self.endog, self.exog, family=Binomial()).fit().params
            start_params = np.append(start_params, [0.5] * self.Z.shape[1])
            #start_params = np.append(np.zeros(self.exog.shape[1]), 0.5)
        #self.exog[0] = np.mean(self.endog)

        return super(BetaReg, self).fit(start_params=start_params,
                                             maxiter=maxiter,
                                             maxfun=maxfun,
                                             **kwds)
    def _ll_br(self, y, X, Z, params):
        nz = self.Z.shape[1]

        Xparams = params[:-nz]
        Zparams = params[-nz:]

        mu = ilogit(np.dot(X, Xparams))
        phi = np.exp(np.dot(Z, Zparams))

        ll = lgamma(phi) - lgamma(mu * phi) - lgamma((1 - mu) * phi) \
                + (mu * phi - 1) * np.log(y) + (((1 - mu) * phi) - 1) * np.log(1 - y)
        print ll.sum()
        return ll

 if __name__ == "__main__":

    import pandas as pd
    dat = pd.read_table('gasoline.txt')
    m = BetaReg.from_formula('iyield ~ C(batch) + temp', dat)
    print m.fit().summary()
    #print GLM.from_formula('iyield ~ C(batch) + temp', dat, family=Binomial()).fit().summary()
diff --git a/ex.R b/ex.R
 library(betareg)

 data("GasolineYield", package = "betareg")
 m = betareg(yield ~ batch + temp, data = GasolineYield)
 print(summary(m))

diff --git a/gasoline.txt b/gasoline.txt
 iyield	gravity	pressure	temp10	temp	batch
 0.122	50.8	8.6	190	205	1
 0.223	50.8	8.6	190	275	1
 0.347	50.8	8.6	190	345	1
 0.457	50.8	8.6	190	407	1
 0.08	40.8	3.5	210	218	2
 0.131	40.8	3.5	210	273	2
 0.266	40.8	3.5	210	347	2
 0.074	40	6.1	217	212	3
 0.182	40	6.1	217	272	3
 0.304	40	6.1	217	340	3
 0.069	38.4	6.1	220	235	4
 0.152	38.4	6.1	220	300	4
 0.26	38.4	6.1	220	365	4
 0.336	38.4	6.1	220	410	4
 0.144	40.3	4.8	231	307	5
 0.268	40.3	4.8	231	367	5
 0.349	40.3	4.8	231	395	5
 0.1	32.2	5.2	236	267	6
 0.248	32.2	5.2	236	360	6
 0.317	32.2	5.2	236	402	6
 0.028	41.3	1.8	267	235	7
 0.064	41.3	1.8	267	275	7
 0.161	41.3	1.8	267	358	7
 0.278	41.3	1.8	267	416	7
 0.05	38.1	1.2	274	285	8
 0.176	38.1	1.2	274	365	8
 0.321	38.1	1.2	274	444	8
 0.14	32.2	2.4	284	351	9
 0.232	32.2	2.4	284	424	9
 0.085	31.8	0.2	316	365	10
 0.147	31.8	0.2	316	379	10
 0.18	31.8	0.2	316	428	10
	import numpy as np
	from scipy.special import gammaln as lgamma
	from statsmodels.base.model import GenericLikelihoodModel
	from statsmodels.api import GLM
	from statsmodels.genmod.families import Binomial

	#see http://cran.r-project.org/web/packages/betareg/vignettes/betareg-ext.pdf

	def ilogit(a):
	return 1 / (1. + np.exp(-a))

	def logit(a):
	return np.log(p / (1. - p))

	class BetaReg(GenericLikelihoodModel):
	def __init__(self, endog, exog, Z=None, **kwds):
	super(BetaReg, self).__init__(endog, exog, **kwds)
	# how to set default Z?
	if Z is None:
	self.Z = np.ones((self.endog.shape[0], 1), dtype='f')
	else:
	self.Z = np.asarray(Z)
	assert len(self.Z) == len(self.endog)

	def nloglikeobs(self, params):
	return -self._ll_br(self.endog, self.exog, self.Z, params)

	def fit(self, start_params=None, maxiter=1000000, maxfun=50000, **kwds):
	if start_params is None:
	start_params = GLM(self.endog, self.exog, family=Binomial()).fit().params
	start_params = np.append(start_params, [0.5] * self.Z.shape[1])
	#start_params = np.append(np.zeros(self.exog.shape[1]), 0.5)
	#self.exog[0] = np.mean(self.endog)

	return super(BetaReg, self).fit(start_params=start_params,
	maxiter=maxiter,
	maxfun=maxfun,
	**kwds)
	def _ll_br(self, y, X, Z, params):
	nz = self.Z.shape[1]

	Xparams = params[:-nz]
	Zparams = params[-nz:]

	mu = ilogit(np.dot(X, Xparams))
	phi = np.exp(np.dot(Z, Zparams))

	ll = lgamma(phi) - lgamma(mu * phi) - lgamma((1 - mu) * phi) \
	+ (mu * phi - 1) * np.log(y) + (((1 - mu) * phi) - 1) * np.log(1 - y)
	print ll.sum()
	return ll

	if __name__ == "__main__":

	import pandas as pd
	dat = pd.read_table('gasoline.txt')
	m = BetaReg.from_formula('iyield ~ C(batch) + temp', dat)
	print m.fit().summary()
	#print GLM.from_formula('iyield ~ C(batch) + temp', dat, family=Binomial()).fit().summary()
	library(betareg)

	data("GasolineYield", package = "betareg")
	m = betareg(yield ~ batch + temp, data = GasolineYield)
	print(summary(m))
	iyield gravity pressure temp10 temp batch
	0.122 50.8 8.6 190 205 1
	0.223 50.8 8.6 190 275 1
	0.347 50.8 8.6 190 345 1
	0.457 50.8 8.6 190 407 1
	0.08 40.8 3.5 210 218 2
	0.131 40.8 3.5 210 273 2
	0.266 40.8 3.5 210 347 2
	0.074 40 6.1 217 212 3
	0.182 40 6.1 217 272 3
	0.304 40 6.1 217 340 3
	0.069 38.4 6.1 220 235 4
	0.152 38.4 6.1 220 300 4
	0.26 38.4 6.1 220 365 4
	0.336 38.4 6.1 220 410 4
	0.144 40.3 4.8 231 307 5
	0.268 40.3 4.8 231 367 5
	0.349 40.3 4.8 231 395 5
	0.1 32.2 5.2 236 267 6
	0.248 32.2 5.2 236 360 6
	0.317 32.2 5.2 236 402 6
	0.028 41.3 1.8 267 235 7
	0.064 41.3 1.8 267 275 7
	0.161 41.3 1.8 267 358 7
	0.278 41.3 1.8 267 416 7
	0.05 38.1 1.2 274 285 8
	0.176 38.1 1.2 274 365 8
	0.321 38.1 1.2 274 444 8
	0.14 32.2 2.4 284 351 9
	0.232 32.2 2.4 284 424 9
	0.085 31.8 0.2 316 365 10
	0.147 31.8 0.2 316 379 10
	0.18 31.8 0.2 316 428 10