source: protocols/jabber/xmltree.c @ f06894d

Last change on this file since f06894d was 8f243ad, checked in by Wilmer van der Gaast <wilmer@…>, at 2006-09-20T09:36:53Z

Removed old Jabber module, started to fill in the new stuff. (xmltree
developed outside this tree)

  • Property mode set to 100644
File size: 12.1 KB
Line 
1/***************************************************************************\
2*                                                                           *
3*  BitlBee - An IRC to IM gateway                                           *
4*  Simple XML (stream) parse tree handling code (Jabber/XMPP, mainly)       *
5*                                                                           *
6*  Copyright 2006 Wilmer van der Gaast <wilmer@gaast.net>                   *
7*                                                                           *
8*  This library is free software; you can redistribute it and/or            *
9*  modify it under the terms of the GNU Lesser General Public               *
10*  License as published by the Free Software Foundation, version            *
11*  2.1.                                                                     *
12*                                                                           *
13*  This library is distributed in the hope that it will be useful,          *
14*  but WITHOUT ANY WARRANTY; without even the implied warranty of           *
15*  MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the GNU        *
16*  Lesser General Public License for more details.                          *
17*                                                                           *
18*  You should have received a copy of the GNU Lesser General Public License *
19*  along with this library; if not, write to the Free Software Foundation,  *
20*  Inc., 51 Franklin St, Fifth Floor, Boston, MA  02110-1301  USA           *
21*                                                                           *
22****************************************************************************/
23
24#include <glib.h>
25#include <string.h>
26#include <unistd.h>
27#include <ctype.h>
28#include <stdio.h>
29
30#include "xmltree.h"
31
32static void xt_start_element( GMarkupParseContext *ctx, const gchar *element_name, const gchar **attr_names, const gchar **attr_values, gpointer data, GError **error )
33{
34        struct xt_parser *xt = data;
35        struct xt_node *node = g_new0( struct xt_node, 1 ), *nt;
36        int i;
37       
38        node->parent = xt->cur;
39        node->name = g_strdup( element_name );
40       
41        /* First count the number of attributes */
42        for( i = 0; attr_names[i]; i ++ );
43       
44        /* Then allocate a NULL-terminated array. */
45        node->attr = g_new0( struct xt_attr, i + 1 );
46       
47        /* And fill it, saving one variable by starting at the end. */
48        for( i --; i >= 0; i -- )
49        {
50                node->attr[i].key = g_strdup( attr_names[i] );
51                node->attr[i].value = g_strdup( attr_values[i] );
52        }
53       
54        /* Add it to the linked list of children nodes, if we have a current
55           node yet. */
56        if( xt->cur )
57        {
58                if( xt->cur->children )
59                {
60                        for( nt = xt->cur->children; nt->next; nt = nt->next );
61                        nt->next = node;
62                }
63                else
64                {
65                        xt->cur->children = node;
66                }
67        }
68        else if( xt->root )
69        {
70                /* ERROR situation: A second root-element??? */
71        }
72       
73        /* Now this node will be the new current node. */
74        xt->cur = node;
75        /* And maybe this is the root? */
76        if( xt->root == NULL )
77                xt->root = node;
78}
79
80static void xt_text( GMarkupParseContext *ctx, const gchar *text, gsize text_len, gpointer data, GError **error )
81{
82        struct xt_parser *xt = data;
83        struct xt_node *node = xt->cur;
84       
85        if( node == NULL )
86                return;
87       
88        /* FIXME: Does g_renew also OFFICIALLY accept NULL arguments? */
89        node->text = g_renew( char, node->text, node->text_len + text_len + 1 );
90        memcpy( node->text + node->text_len, text, text_len );
91        node->text_len += text_len;
92        /* Zero termination is always nice to have. */
93        node->text[node->text_len] = 0;
94}
95
96static void xt_end_element( GMarkupParseContext *ctx, const gchar *element_name, gpointer data, GError **error )
97{
98        struct xt_parser *xt = data;
99       
100        xt->cur->flags |= XT_COMPLETE;
101        xt->cur = xt->cur->parent;
102}
103
104GMarkupParser xt_parser_funcs =
105{
106        xt_start_element,
107        xt_end_element,
108        xt_text,
109        NULL,
110        NULL
111};
112
113struct xt_parser *xt_new( gpointer data )
114{
115        struct xt_parser *xt = g_new0( struct xt_parser, 1 );
116       
117        xt->data = data;
118        xt_reset( xt );
119       
120        return xt;
121}
122
123/* Reset the parser, flush everything we have so far. For example, we need
124   this for XMPP when doing TLS/SASL to restart the stream. */
125void xt_reset( struct xt_parser *xt )
126{
127        if( xt->parser )
128                g_markup_parse_context_free( xt->parser );
129       
130        xt->parser = g_markup_parse_context_new( &xt_parser_funcs, 0, xt, NULL );
131       
132        if( xt->root )
133        {
134                xt_free_node( xt->root );
135                xt->root = NULL;
136                xt->cur = NULL;
137        }
138}
139
140/* Feed the parser, don't execute any handler. Returns -1 on errors, 0 on
141   end-of-stream and 1 otherwise. */
142int xt_feed( struct xt_parser *xt, char *text, int text_len )
143{
144        if( !g_markup_parse_context_parse( xt->parser, text, text_len, &xt->gerr ) )
145        {
146                return -1;
147        }
148       
149        return !( xt->root && xt->root->flags & XT_COMPLETE );
150}
151
152/* Find completed nodes and see if a handler has to be called. Passing
153   a node isn't necessary if you want to start at the root, just pass
154   NULL. This second argument is needed for recursive calls. FIXME: Retval? */
155int xt_handle( struct xt_parser *xt, struct xt_node *node )
156{
157        struct xt_node *c;
158        xt_status st;
159        int i;
160       
161        /* Let's just hope xt->root isn't NULL! */
162        if( node == NULL )
163                return xt_handle( xt, xt->root );
164       
165        for( c = node->children; c; c = c->next )
166                if( !xt_handle( xt, c ) )
167                        return 0;
168       
169        if( node->flags & XT_COMPLETE && !( node->flags & XT_SEEN ) )
170        {
171                for( i = 0; xt->handlers[i].func; i ++ )
172                {
173                        /* This one is fun! \o/ */
174                       
175                                                /* If handler.name == NULL it means it should always match. */
176                        if( ( xt->handlers[i].name == NULL || 
177                                                /* If it's not, compare. There should always be a name. */
178                              g_strcasecmp( xt->handlers[i].name, node->name ) == 0 ) &&
179                                                /* If handler.parent == NULL, it's a match. */
180                            ( xt->handlers[i].parent == NULL ||
181                                                /* If there's a parent node, see if the name matches. */
182                              ( node->parent ? g_strcasecmp( xt->handlers[i].parent, node->parent->name ) == 0 : 
183                                                /* If there's no parent, the handler should mention <root> as a parent. */
184                                               g_strcasecmp( xt->handlers[i].parent, "<root>" ) == 0 ) ) )
185                        {
186                                st = xt->handlers[i].func( node, xt->data );
187                               
188                                if( st == XT_ABORT )
189                                        return 0;
190                                else if( st != XT_NEXT )
191                                        break;
192                        }
193                }
194               
195                node->flags |= XT_SEEN;
196        }
197       
198        return 1;
199}
200
201/* Garbage collection: Cleans up all nodes that are handled. Useful for
202   streams because there's no reason to keep a complete packet history
203   in memory. */
204void xt_cleanup( struct xt_parser *xt, struct xt_node *node )
205{
206        struct xt_node *c, *prev;
207       
208        /* Let's just hope xt->root isn't NULL! */
209        if( node == NULL )
210                return xt_cleanup( xt, xt->root );
211       
212        if( node->flags & XT_SEEN && node == xt->root )
213        {
214                xt_free_node( xt->root );
215                xt->root = xt->cur = NULL;
216                /* xt->cur should be NULL already, BTW... */
217               
218                return;
219        }
220       
221        /* c contains the current node, prev the previous node (or NULL).
222           I admit, this one's pretty horrible. */
223        for( c = node->children, prev = NULL; c; prev = c, c = c ? c->next : node->children )
224        {
225                if( c->flags & XT_SEEN )
226                {
227                        /* Remove the node from the linked list. */
228                        if( prev )
229                                prev->next = c->next;
230                        else
231                                node->children = c->next;
232                       
233                        xt_free_node( c );
234                       
235                        /* Since the for loop wants to get c->next, make sure
236                           c points at something that exists (and that c->next
237                           will actually be the next item we should check). c
238                           can be NULL now, if we just removed the first item.
239                           That explains the ? thing in for(). */
240                        c = prev;
241                }
242                else
243                {
244                        /* This node can't be cleaned up yet, but maybe a
245                           subnode can. */
246                        xt_cleanup( xt, c );
247                }
248        }
249}
250
251static void xt_to_string_real( struct xt_node *node, GString *str )
252{
253        char *buf;
254        struct xt_node *c;
255        int i;
256       
257        g_string_append_printf( str, "<%s", node->name );
258       
259        for( i = 0; node->attr[i].key; i ++ )
260        {
261                buf = g_markup_printf_escaped( " %s=\"%s\"", node->attr[i].key, node->attr[i].value );
262                g_string_append( str, buf );
263                g_free( buf );
264        }
265       
266        if( node->text == NULL && node->children == NULL )
267        {
268                g_string_append( str, "/>" );
269                return;
270        }
271       
272        g_string_append( str, ">" );
273        if( node->text_len > 0 )
274        {
275                buf = g_markup_escape_text( node->text, node->text_len );
276                g_string_append( str, buf );
277                g_free( buf );
278        }
279       
280        for( c = node->children; c; c = c->next )
281                xt_to_string_real( c, str );
282       
283        g_string_append_printf( str, "</%s>", node->name );
284}
285
286char *xt_to_string( struct xt_node *node )
287{
288        GString *ret;
289        char *real;
290       
291        ret = g_string_new( "" );
292        xt_to_string_real( node, ret );
293       
294        real = ret->str;
295        g_string_free( ret, FALSE );
296       
297        return real;
298}
299
300void xt_print( struct xt_node *node )
301{
302        int i;
303        struct xt_node *c;
304       
305        printf( "%s\n", xt_to_string( node ) );
306        return;
307       
308        /* Indentation */
309        for( c = node; c->parent; c = c->parent )
310                printf( "\t" );
311       
312        /* Start the tag */
313        printf( "<%s", node->name );
314       
315        /* Print the attributes */
316        for( i = 0; node->attr[i].key; i ++ )
317                printf( " %s=\"%s\"", node->attr[i].key, g_markup_escape_text( node->attr[i].value, -1 ) );
318       
319        /* /> in case there's really *nothing* inside this tag, otherwise
320           just >. */
321        /* If this tag doesn't have any content at all... */
322        if( node->text == NULL && node->children == NULL )
323        {
324                printf( "/>\n" );
325                return;
326                /* Then we're finished! */
327        }
328       
329        /* Otherwise... */
330        printf( ">" );
331       
332        /* Only print the text if it contains more than whitespace (TEST). */
333        if( node->text_len > 0 )
334        {
335                for( i = 0; node->text[i] && isspace( node->text[i] ); i ++ );
336                if( node->text[i] )
337                        printf( "%s", g_markup_escape_text( node->text, -1 ) );
338        }
339       
340        if( node->children )
341                printf( "\n" );
342       
343        for( c = node->children; c; c = c->next )
344                xt_print( c );
345       
346        if( node->children )
347                for( c = node; c->parent; c = c->parent )
348                        printf( "\t" );
349       
350        /* Non-empty tag is now finished. */
351        printf( "</%s>\n", node->name );
352}
353
354/* Frees a node. This doesn't clean up references to itself from parents! */
355void xt_free_node( struct xt_node *node )
356{
357        int i;
358       
359        g_free( node->name );
360        g_free( node->text );
361       
362        for( i = 0; node->attr[i].key; i ++ )
363        {
364                g_free( node->attr[i].key );
365                g_free( node->attr[i].value );
366        }
367        g_free( node->attr );
368       
369        while( node->children )
370        {
371                struct xt_node *next = node->children->next;
372               
373                xt_free_node( node->children );
374                node->children = next;
375        }
376       
377        g_free( node );
378}
379
380void xt_free( struct xt_parser *xt )
381{
382        if( xt->root )
383                xt_free_node( xt->root );
384       
385        g_markup_parse_context_free( xt->parser );
386       
387        g_free( xt );
388}
389
390/* To find a node's child with a specific name, pass the node's children
391   list, not the node itself! The reason you have to do this by hand: So
392   that you can also use this function as a find-next. */
393struct xt_node *xt_find_node( struct xt_node *node, char *name )
394{
395        while( node )
396        {
397                if( g_strcasecmp( node->name, name ) == 0 )
398                        break;
399               
400                node = node->next;
401        }
402       
403        return node;
404}
405
406char *xt_find_attr( struct xt_node *node, char *key )
407{
408        int i;
409       
410        for( i = 0; node->attr[i].key; i ++ )
411                if( g_strcasecmp( node->attr[i].key, key ) == 0 )
412                        break;
413       
414        return node->attr[i].value;
415}
416
417struct xt_node *xt_new_node( char *name, char *text, struct xt_node *children )
418{
419        struct xt_node *node, *c;
420       
421        node = g_new0( struct xt_node, 1 );
422        node->name = g_strdup( name );
423        node->children = children;
424        node->attr = g_new0( struct xt_attr, 1 );
425       
426        if( text )
427        {
428                node->text_len = strlen( text );
429                node->text = g_memdup( text, node->text_len );
430        }
431       
432        for( c = children; c; c = c->next )
433        {
434                if( c->parent != NULL )
435                {
436                        /* ERROR CONDITION: They seem to have a parent already??? */
437                }
438               
439                c->parent = node;
440        }
441       
442        return node;
443}
444
445void xt_add_child( struct xt_node *parent, struct xt_node *child )
446{
447        struct xt_node *node;
448       
449        /* This function can actually be used to add more than one child, so
450           do handle this properly. */
451        for( node = child; node; node = node->next )
452        {
453                if( node->parent != NULL )
454                {
455                        /* ERROR CONDITION: They seem to have a parent already??? */
456                }
457               
458                node->parent = parent;
459        }
460       
461        if( parent->children == NULL )
462        {
463                parent->children = child;
464        }
465        else
466        {
467                for( node = parent->children; node->next; node = node->next );
468                node->next = child;
469        }
470}
471
472void xt_add_attr( struct xt_node *node, char *key, char *value )
473{
474        int i;
475       
476        for( i = 0; node->attr[i].key; i ++ );
477        node->attr = g_renew( struct xt_attr, node->attr, i + 2 );
478        node->attr[i].key = g_strdup( key );
479        node->attr[i].value = g_strdup( value );
480        node->attr[i+1].key = NULL;
481}
Note: See TracBrowser for help on using the repository browser.