source: lib/http_client.c @ 3923003

Last change on this file since 3923003 was fb98634, checked in by Wilmer van der Gaast <wilmer@…>, at 2008-09-28T13:09:36Z

Fixed crappy memory management in http_client.

  • Property mode set to 100644
File size: 10.4 KB
RevLine 
[8a9afe4]1  /********************************************************************\
2  * BitlBee -- An IRC to other IM-networks gateway                     *
3  *                                                                    *
4  * Copyright 2002-2005 Wilmer van der Gaast and others                *
5  \********************************************************************/
6
[52b3a99]7/* HTTP(S) module                                                       */
[8a9afe4]8
9/*
10  This program is free software; you can redistribute it and/or modify
11  it under the terms of the GNU General Public License as published by
12  the Free Software Foundation; either version 2 of the License, or
13  (at your option) any later version.
14
15  This program is distributed in the hope that it will be useful,
16  but WITHOUT ANY WARRANTY; without even the implied warranty of
17  MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the
18  GNU General Public License for more details.
19
20  You should have received a copy of the GNU General Public License with
21  the Debian GNU/Linux distribution in /usr/share/common-licenses/GPL;
22  if not, write to the Free Software Foundation, Inc., 59 Temple Place,
23  Suite 330, Boston, MA  02111-1307  USA
24*/
25
26#include <string.h>
[52b3a99]27#include <stdio.h>
[8a9afe4]28
29#include "http_client.h"
[52b3a99]30#include "url.h"
[e4d6271]31#include "sock.h"
[8a9afe4]32
33
[ba9edaa]34static gboolean http_connected( gpointer data, int source, b_input_condition cond );
35static gboolean http_ssl_connected( gpointer data, void *source, b_input_condition cond );
36static gboolean http_incoming_data( gpointer data, int source, b_input_condition cond );
[8a9afe4]37
38
[f3e1e92]39void *http_dorequest( char *host, int port, int ssl, char *request, http_input_function func, gpointer data )
[8a9afe4]40{
41        struct http_request *req;
42        int error = 0;
43       
44        req = g_new0( struct http_request, 1 );
45       
46        if( ssl )
47        {
48                req->ssl = ssl_connect( host, port, http_ssl_connected, req );
49                if( req->ssl == NULL )
50                        error = 1;
51        }
52        else
53        {
54                req->fd = proxy_connect( host, port, http_connected, req );
55                if( req->fd < 0 )
56                        error = 1;
57        }
58       
59        if( error )
60        {
[fb98634]61                http_free( req );
62                return NULL;
[8a9afe4]63        }
64       
[52b3a99]65        req->func = func;
66        req->data = data;
[8a9afe4]67        req->request = g_strdup( request );
68        req->request_length = strlen( request );
69       
70        return( req );
71}
72
[0790644]73void *http_dorequest_url( char *url_string, http_input_function func, gpointer data )
74{
75        url_t *url = g_new0( url_t, 1 );
76        char *request;
77        void *ret;
78       
79        if( !url_set( url, url_string ) )
80        {
81                g_free( url );
82                return NULL;
83        }
84       
85        if( url->proto != PROTO_HTTP && url->proto != PROTO_HTTPS )
86        {
87                g_free( url );
88                return NULL;
89        }
90       
91        request = g_strdup_printf( "GET %s HTTP/1.0\r\n"
92                                   "Host: %s\r\n"
[1b5ab36]93                                   "User-Agent: BitlBee " BITLBEE_VERSION " " ARCH "/" CPU "\r\n"
[0790644]94                                   "\r\n", url->file, url->host );
95       
96        ret = http_dorequest( url->host, url->port,
97                              url->proto == PROTO_HTTPS, request, func, data );
98       
99        g_free( url );
100        g_free( request );
[266fe2f]101        return ret;
[0790644]102}
103
[8a9afe4]104/* This one is actually pretty simple... Might get more calls if we can't write
105   the whole request at once. */
[ba9edaa]106static gboolean http_connected( gpointer data, int source, b_input_condition cond )
[8a9afe4]107{
108        struct http_request *req = data;
109        int st;
110       
111        if( source < 0 )
112                goto error;
113       
114        if( req->inpa > 0 )
[ba9edaa]115                b_event_remove( req->inpa );
[8a9afe4]116       
117        sock_make_nonblocking( req->fd );
118       
119        if( req->ssl )
120        {
121                st = ssl_write( req->ssl, req->request + req->bytes_written,
122                                req->request_length - req->bytes_written );
123                if( st < 0 )
124                {
125                        if( ssl_errno != SSL_AGAIN )
126                        {
127                                ssl_disconnect( req->ssl );
128                                goto error;
129                        }
130                }
131        }
132        else
133        {
134                st = write( source, req->request + req->bytes_written,
135                                    req->request_length - req->bytes_written );
136                if( st < 0 )
137                {
138                        if( !sockerr_again() )
139                        {
[52b3a99]140                                closesocket( req->fd );
[8a9afe4]141                                goto error;
142                        }
143                }
144        }
145       
146        if( st > 0 )
147                req->bytes_written += st;
148       
149        if( req->bytes_written < req->request_length )
[ba9edaa]150                req->inpa = b_input_add( source,
151                                         req->ssl ? ssl_getdirection( req->ssl ) : GAIM_INPUT_WRITE,
152                                         http_connected, req );
[8a9afe4]153        else
[ba9edaa]154                req->inpa = b_input_add( source, GAIM_INPUT_READ, http_incoming_data, req );
[8a9afe4]155       
[ba9edaa]156        return FALSE;
[8a9afe4]157       
158error:
[7deb447]159        req->status_string = g_strdup( "Error while writing HTTP request" );
160       
[8a9afe4]161        req->func( req );
[fb98634]162        http_free( req );
[ba9edaa]163        return FALSE;
[8a9afe4]164}
165
[ba9edaa]166static gboolean http_ssl_connected( gpointer data, void *source, b_input_condition cond )
[8a9afe4]167{
168        struct http_request *req = data;
169       
170        if( source == NULL )
171                return http_connected( data, -1, cond );
172       
173        req->fd = ssl_getfd( source );
174       
175        return http_connected( data, req->fd, cond );
176}
177
[ba9edaa]178static gboolean http_incoming_data( gpointer data, int source, b_input_condition cond )
[8a9afe4]179{
180        struct http_request *req = data;
181        int evil_server = 0;
182        char buffer[2048];
183        char *end1, *end2;
184        int st;
185       
186        if( req->inpa > 0 )
[ba9edaa]187                b_event_remove( req->inpa );
[8a9afe4]188       
189        if( req->ssl )
190        {
191                st = ssl_read( req->ssl, buffer, sizeof( buffer ) );
192                if( st < 0 )
193                {
194                        if( ssl_errno != SSL_AGAIN )
195                        {
[ad8b8a3]196                                /* goto cleanup; */
197                               
198                                /* YAY! We have to deal with crappy Microsoft
199                                   servers that LOVE to send invalid TLS
200                                   packets that abort connections! \o/ */
201                               
202                                goto got_reply;
[8a9afe4]203                        }
204                }
205                else if( st == 0 )
206                {
207                        goto got_reply;
208                }
209        }
210        else
211        {
212                st = read( req->fd, buffer, sizeof( buffer ) );
213                if( st < 0 )
214                {
215                        if( !sockerr_again() )
216                        {
[7deb447]217                                req->status_string = g_strdup( strerror( errno ) );
[8a9afe4]218                                goto cleanup;
219                        }
220                }
221                else if( st == 0 )
222                {
223                        goto got_reply;
224                }
225        }
226       
227        if( st > 0 )
228        {
229                req->reply_headers = g_realloc( req->reply_headers, req->bytes_read + st + 1 );
230                memcpy( req->reply_headers + req->bytes_read, buffer, st );
[52b3a99]231                req->bytes_read += st;
[8a9afe4]232        }
233       
234        /* There will be more! */
[ba9edaa]235        req->inpa = b_input_add( req->fd,
236                                 req->ssl ? ssl_getdirection( req->ssl ) : GAIM_INPUT_READ,
237                                 http_incoming_data, req );
[8a9afe4]238       
[ba9edaa]239        return FALSE;
[8a9afe4]240
241got_reply:
[0602496]242        /* Maybe if the webserver is overloaded, or when there's bad SSL
243           support... */
244        if( req->bytes_read == 0 )
[7deb447]245        {
246                req->status_string = g_strdup( "Empty HTTP reply" );
[0602496]247                goto cleanup;
[7deb447]248        }
[0602496]249       
[8a9afe4]250        /* Zero termination is very convenient. */
251        req->reply_headers[req->bytes_read] = 0;
252       
253        /* Find the separation between headers and body, and keep stupid
254           webservers in mind. */
255        end1 = strstr( req->reply_headers, "\r\n\r\n" );
256        end2 = strstr( req->reply_headers, "\n\n" );
257       
258        if( end2 && end2 < end1 )
259        {
[52b3a99]260                end1 = end2 + 1;
[8a9afe4]261                evil_server = 1;
262        }
[0eec386]263        else if( end1 )
[52b3a99]264        {
265                end1 += 2;
266        }
[0eec386]267        else
[8a9afe4]268        {
[7deb447]269                req->status_string = g_strdup( "Malformed HTTP reply" );
[0eec386]270                goto cleanup;
[52b3a99]271        }
272       
[0eec386]273        *end1 = 0;
274       
275        if( evil_server )
276                req->reply_body = end1 + 1;
277        else
278                req->reply_body = end1 + 2;
279       
[41e5202]280        req->body_size = req->reply_headers + req->bytes_read - req->reply_body;
[0eec386]281       
[52b3a99]282        if( ( end1 = strchr( req->reply_headers, ' ' ) ) != NULL )
283        {
284                if( sscanf( end1 + 1, "%d", &req->status_code ) != 1 )
[7deb447]285                {
286                        req->status_string = g_strdup( "Can't parse status code" );
[52b3a99]287                        req->status_code = -1;
[7deb447]288                }
289                else
290                {
291                        char *eol;
292                       
293                        if( evil_server )
294                                eol = strchr( end1, '\n' );
295                        else
296                                eol = strchr( end1, '\r' );
297                       
298                        req->status_string = g_strndup( end1 + 1, eol - end1 - 1 );
299                       
300                        /* Just to be sure... */
301                        if( ( eol = strchr( req->status_string, '\r' ) ) )
302                                *eol = 0;
303                        if( ( eol = strchr( req->status_string, '\n' ) ) )
304                                *eol = 0;
305                }
[52b3a99]306        }
307        else
308        {
[7deb447]309                req->status_string = g_strdup( "Can't locate status code" );
[52b3a99]310                req->status_code = -1;
311        }
312       
313        if( req->status_code == 301 || req->status_code == 302 )
314        {
315                char *loc, *new_request, *new_host;
316                int error = 0, new_port, new_proto;
317               
[7deb447]318                /* We might fill it again, so let's not leak any memory. */
319                g_free( req->status_string );
320                req->status_string = NULL;
321               
[52b3a99]322                loc = strstr( req->reply_headers, "\nLocation: " );
323                if( loc == NULL ) /* We can't handle this redirect... */
[7deb447]324                {
325                        req->status_string = g_strdup( "Can't locate Location: header" );
[52b3a99]326                        goto cleanup;
[7deb447]327                }
[52b3a99]328               
329                loc += 11;
330                while( *loc == ' ' )
331                        loc ++;
332               
333                /* TODO/FIXME: Possibly have to handle relative redirections,
334                   and rewrite Host: headers. Not necessary for now, it's
335                   enough for passport authentication like this. */
336               
337                if( *loc == '/' )
338                {
339                        /* Just a different pathname... */
340                       
341                        /* Since we don't cache the servername, and since we
342                           don't need this yet anyway, I won't implement it. */
343                       
[7deb447]344                        req->status_string = g_strdup( "Can't handle recursive redirects" );
345                       
[52b3a99]346                        goto cleanup;
347                }
[8a9afe4]348                else
[52b3a99]349                {
350                        /* A whole URL */
351                        url_t *url;
352                        char *s;
353                       
354                        s = strstr( loc, "\r\n" );
355                        if( s == NULL )
356                                goto cleanup;
357                       
358                        url = g_new0( url_t, 1 );
359                        *s = 0;
360                       
361                        if( !url_set( url, loc ) )
362                        {
[7deb447]363                                req->status_string = g_strdup( "Malformed redirect URL" );
[52b3a99]364                                g_free( url );
365                                goto cleanup;
366                        }
367                       
368                        /* Okay, this isn't fun! We have to rebuild the request... :-( */
369                        new_request = g_malloc( req->request_length + strlen( url->file ) );
370                       
371                        /* So, now I just allocated enough memory, so I'm
372                           going to use strcat(), whether you like it or not. :-) */
373                       
[fe23720]374                        sprintf( new_request, "GET %s HTTP/1.0", url->file );
[52b3a99]375                       
376                        s = strstr( req->request, "\r\n" );
377                        if( s == NULL )
378                        {
[7deb447]379                                req->status_string = g_strdup( "Error while rebuilding request string" );
[52b3a99]380                                g_free( new_request );
381                                g_free( url );
382                                goto cleanup;
383                        }
384                       
[fe23720]385                        strcat( new_request, s );
[52b3a99]386                        new_host = g_strdup( url->host );
387                        new_port = url->port;
388                        new_proto = url->proto;
389                       
390                        g_free( url );
391                }
392               
393                if( req->ssl )
394                        ssl_disconnect( req->ssl );
395                else
396                        closesocket( req->fd );
397               
398                req->fd = -1;
[7deb447]399                req->ssl = NULL;
[52b3a99]400               
401                if( new_proto == PROTO_HTTPS )
402                {
403                        req->ssl = ssl_connect( new_host, new_port, http_ssl_connected, req );
404                        if( req->ssl == NULL )
405                                error = 1;
406                }
407                else
408                {
409                        req->fd = proxy_connect( new_host, new_port, http_connected, req );
410                        if( req->fd < 0 )
411                                error = 1;
412                }
[2db811a]413                g_free( new_host );
[52b3a99]414               
415                if( error )
416                {
[7deb447]417                        req->status_string = g_strdup( "Connection problem during redirect" );
[52b3a99]418                        g_free( new_request );
419                        goto cleanup;
420                }
421               
422                g_free( req->request );
423                g_free( req->reply_headers );
424                req->request = new_request;
425                req->request_length = strlen( new_request );
426                req->bytes_read = req->bytes_written = req->inpa = 0;
427                req->reply_headers = req->reply_body = NULL;
428               
[ba9edaa]429                return FALSE;
[8a9afe4]430        }
431       
432        /* Assume that a closed connection means we're finished, this indeed
433           breaks with keep-alive connections and faulty connections. */
434        req->finished = 1;
435
436cleanup:
437        if( req->ssl )
438                ssl_disconnect( req->ssl );
439        else
[52b3a99]440                closesocket( req->fd );
[8a9afe4]441       
442        req->func( req );
[fb98634]443        http_free( req );
444        return FALSE;
445}
446
447void http_free( struct http_request *req )
448{
[8a9afe4]449        g_free( req->request );
450        g_free( req->reply_headers );
[7deb447]451        g_free( req->status_string );
[8a9afe4]452        g_free( req );
453}
[fb98634]454
Note: See TracBrowser for help on using the repository browser.