do non blocking connects
[spider.git] / perl / cluster.pl
index 32f90d88ded118a462f2b75bc247352d3d23c726..eef7a40cd02d4fa5c970517192c35d3aba9aa689 100755 (executable)
@@ -1,4 +1,4 @@
-#!/usr/bin/perl
+#!/usr/bin/perl -w
 #
 # This is the DX cluster 'daemon'. It sits in the middle of its little
 # web of client routines sucking and blowing data where it may.
@@ -14,6 +14,8 @@ require 5.004;
 
 # make sure that modules are searched in the order local then perl
 BEGIN {
+       umask 002;
+       
        # root of directory tree for this system
        $root = "/spider"; 
        $root = $ENV{'DXSPIDER_ROOT'} if $ENV{'DXSPIDER_ROOT'};
@@ -21,11 +23,24 @@ BEGIN {
        unshift @INC, "$root/perl";     # this IS the right way round!
        unshift @INC, "$root/local";
 
-#      require Exporter;
-#      $Exporter::Verbose = 1;
+       # try to create and lock a lockfile (this isn't atomic but 
+       # should do for now
+       my $lockfn = "$root/perl/cluster.lock";       # lock file name
+       if (-e $lockfn) {
+               open(CLLOCK, "$lockfn") or die "Can't open Lockfile ($lockfn) $!";
+               my $pid = <CLLOCK>;
+               chomp $pid;
+               die "Lockfile ($lockfn) and process $pid exist, another cluster running?" if kill 0, $pid;
+               close CLLOCK;
+       }
+       open(CLLOCK, ">$lockfn") or die "Can't open Lockfile ($lockfn) $!";
+       print CLLOCK "$$\n";
+       close CLLOCK;
 }
 
 use Msg;
+use IntMsg;
+use ExtMsg;
 use DXVars;
 use DXDebug;
 use DXLog;
@@ -44,23 +59,34 @@ use Prefix;
 use Bands;
 use Geomag;
 use CmdAlias;
-use Carp;
+use Filter;
+use DXDb;
+use AnnTalk;
+use WCY;
+use DXDupe;
+use BadWords;
+
+use Data::Dumper;
+use Fcntl ':flock'; 
+use POSIX ":sys_wait_h";
+
+use Local;
 
 package main;
 
+#use strict;
+#use vars qw(@inqueue $systime $version $starttime $lockfn @outstanding_connects $zombies $root
+#                 $lang $myalias @debug $userfn $clusteraddr $clusterport $mycall $decease );
+
 @inqueue = ();                                 # the main input queue, an array of hashes
 $systime = 0;                                  # the time now (in seconds)
-$version = "1.13";                             # the version no of the software
+$version = "1.47";                             # the version no of the software
 $starttime = 0;                 # the starting time of the cluster   
-# handle disconnections
-sub disconnect
-{
-       my $dxchan = shift;
-       return if !defined $dxchan;
-       $dxchan->disconnect();
-}
+$lockfn = "cluster.lock";       # lock file name
+#@outstanding_connects = ();     # list of outstanding connects
+@listeners = ();                               # list of listeners
 
+      
 # send a message to call on conn and disconnect
 sub already_conn
 {
@@ -68,42 +94,50 @@ sub already_conn
        
        dbg('chan', "-> D $call $mess\n"); 
        $conn->send_now("D$call|$mess");
-       sleep(1);
-       dbg('chan', "-> Z $call bye\n");
-       $conn->send_now("Z$call|bye"); # this will cause 'client' to disconnect
+       sleep(2);
+       $conn->disconnect;
+}
+
+sub error_handler
+{
+       my $dxchan = shift;
+       $dxchan->disconnect;
 }
 
 # handle incoming messages
 sub rec
 {
-       my ($conn, $msg, $err) = @_;
+       my ($conn, $msg) = @_;
        my $dxchan = DXChannel->get_by_cnum($conn); # get the dxconnnect object for this message
+       my ($sort, $call, $line) = DXChannel::decode_input(0, $msg);
+       return unless defined $sort;
        
-       if (defined $err && $err) {
-               disconnect($dxchan) if defined $dxchan;
-               return;
-       }
-       
-       # set up the basic channel info - this needs a bit more thought - there is duplication here
+       # set up the basic channel info
        if (!defined $dxchan) {
-               my ($sort, $call, $line) = $msg =~ /^(\w)(\S+)\|(.*)$/;
-               
-               # is there one already connected elsewhere in the cluster (and not a cluster)
+
+               # is there one already connected to me - locally? 
                my $user = DXUser->get($call);
+               if ($sort ne 'O' && Msg->conns($call)) {
+                       my $mess = DXM::msg($lang, ($user && $user->is_node) ? 'concluster' : 'conother', $call, $main::mycall);
+                       already_conn($conn, $call, $mess);
+                       return;
+               }
+               
+               # is there one already connected elsewhere in the cluster?
                if ($user) {
-                       if (($user->sort eq 'A' || $call == $myalias) && !DXCluster->get_exact($call)) {
+                       if (($user->is_node || $call eq $myalias) && !DXCluster->get_exact($call)) {
                                ;
                        } else {
-                               if (DXCluster->get($call) || DXChannel->get($call)) {
-                                       my $mess = DXM::msg($lang, $user->sort eq 'A' ? 'concluster' : 'conother', $call);
+                               if (my $ref = DXCluster->get_exact($call)) {
+                                       my $mess = DXM::msg($lang, 'concluster', $call, $ref->mynode->call);
                                        already_conn($conn, $call, $mess);
                                        return;
                                }
                        }
                        $user->{lang} = $main::lang if !$user->{lang}; # to autoupdate old systems
                } else {
-                       if (DXCluster->get($call)) {
-                               my $mess = DXM::msg($lang, 'conother', $call);
+                       if (my $ref = DXCluster->get_exact($call)) {
+                               my $mess = DXM::msg($lang, 'concluster', $call, $ref->mynode->call);
                                already_conn($conn, $call, $mess);
                                return;
                        }
@@ -113,13 +147,18 @@ sub rec
                # is he locked out ?
                if ($user->lockout) {
                        Log('DXCommand', "$call is locked out, disconnected");
-                       $conn->send_now("Z$call|bye"); # this will cause 'client' to disconnect
+                       $conn->disconnect;
                        return;
                }
 
+               # mark him up
+               $conn->conns($call) unless $sort eq 'O';
+               $conn->set_error(sub {error_handler($dxchan)});
+               
                # create the channel
-               $dxchan = DXCommandmode->new($call, $conn, $user) if ($user->sort eq 'U');
-               $dxchan = DXProt->new($call, $conn, $user) if ($user->sort eq 'A');
+               $dxchan = DXCommandmode->new($call, $conn, $user) if $user->is_user;
+               $dxchan = DXProt->new($call, $conn, $user) if $user->is_node;
+               $dxchan = BBS->new($call, $conn, $user) if $user->is_bbs;
                die "Invalid sort of user on $call = $sort" if !$dxchan;
        }
        
@@ -141,17 +180,66 @@ sub login
 sub cease
 {
        my $dxchan;
+
+       $SIG{'TERM'} = 'IGNORE';
+       $SIG{'INT'} = 'IGNORE';
+       
+       DXUser::sync;
+
+       eval {
+               Local::finish();   # end local processing
+       };
+       dbg('local', "Local::finish error $@") if $@;
+
+       # disconnect nodes
        foreach $dxchan (DXChannel->get_all()) {
-               disconnect($dxchan) unless $dxchan == $DXProt::me;
+               next unless $dxchan->is_node;
+           $dxchan->disconnect unless $dxchan == $DXProt::me;
+       }
+       Msg->event_loop(1, 0.05);
+       Msg->event_loop(1, 0.05);
+
+       # disconnect users
+       foreach $dxchan (DXChannel->get_all()) {
+               next if $dxchan->is_node;
+               $dxchan->disconnect unless $dxchan == $DXProt::me;
+       }
+       Msg->event_loop(1, 0.05);
+       Msg->event_loop(1, 0.05);
+       Msg->event_loop(1, 0.05);
+       Msg->event_loop(1, 0.05);
+       Msg->event_loop(1, 0.05);
+       Msg->event_loop(1, 0.05);
+       DXUser::finish();
+       DXDupe::finish();
+
+       # close all databases
+       DXDb::closeall;
+
+       # close all listeners
+       for (@listeners) {
+               $_->close_server;
        }
+
+       dbg('chan', "DXSpider version $version ended");
        Log('cluster', "DXSpider V$version stopped");
+       dbgclose();
+       Logclose();
+       unlink $lockfn;
+#      $SIG{__WARN__} = $SIG{__DIE__} =  sub {my $a = shift; cluck($a); };
        exit(0);
 }
 
 # the reaper of children
 sub reap
 {
-       my $cpid = wait;
+       my $cpid;
+       while (($cpid = waitpid(-1, WNOHANG)) > 0) {
+               dbg('reap', "cpid: $cpid");
+#              Msg->pid_gone($cpid);
+               $zombies-- if $zombies > 0;
+       }
+       dbg('reap', "cpid: $cpid");
 }
 
 # this is where the input queue is dealt with and things are dispatched off to other parts of
@@ -163,24 +251,25 @@ sub process_inqueue
        
        my $data = $self->{data};
        my $dxchan = $self->{dxchan};
-       my ($sort, $call, $line) = $data =~ /^(\w)(\S+)\|(.*)$/;
+       my $error;
+       my ($sort, $call, $line) = DXChannel::decode_input($dxchan, $data);
+       return unless defined $sort;
        
        # do the really sexy console interface bit! (Who is going to do the TK interface then?)
        dbg('chan', "<- $sort $call $line\n") unless $sort eq 'D';
-       
+
        # handle A records
        my $user = $dxchan->user;
        if ($sort eq 'A' || $sort eq 'O') {
                $dxchan->start($line, $sort);  
        } elsif ($sort eq 'I') {
                die "\$user not defined for $call" if !defined $user;
-               
                # normal input
                $dxchan->normal($line);
-               
-               disconnect($dxchan) if ($dxchan->{state} eq 'bye');
+               $dxchan->disconnect if ($dxchan->{state} eq 'bye');
        } elsif ($sort eq 'Z') {
-               disconnect($dxchan);
+               $dxchan->conn(undef);
+               $dxchan->disconnect;
        } elsif ($sort eq 'D') {
                ;                       # ignored (an echo)
        } else {
@@ -205,8 +294,10 @@ sub uptime
 #############################################################
 
 $starttime = $systime = time;
+$lang = 'en' unless $lang;
 
 # open the debug file, set various FHs to be unbuffered
+dbginit();
 foreach (@debug) {
        dbgadd($_);
 }
@@ -215,29 +306,63 @@ STDOUT->autoflush(1);
 Log('cluster', "DXSpider V$version started");
 
 # banner
-print "DXSpider DX Cluster Version $version\nCopyright (c) 1998 Dirk Koopman G1TLH\n";
+dbg('err', "DXSpider DX Cluster Version $version", "Copyright (c) 1998-2001 Dirk Koopman G1TLH");
 
 # load Prefixes
-print "loading prefixes ...\n";
+dbg('err', "loading prefixes ...");
 Prefix::load();
 
 # load band data
-print "loading band data ...\n";
+dbg('err', "loading band data ...");
 Bands::load();
 
 # initialise User file system
-print "loading user file system ...\n"
-DXUser->init($userfn);
+dbg('err', "loading user file system ...")
+DXUser->init($userfn, 1);
 
 # start listening for incoming messages/connects
-print "starting listener ...\n";
-Msg->new_server("$clusteraddr", $clusterport, \&login);
+use Listeners;
+
+dbg('err', "starting listeners ...");
+my $conn = IntMsg->new_server($clusteraddr, $clusterport, \&login);
+$conn->conns("Server $clusteraddr/$clusterport");
+push @listeners, $conn;
+dbg('err', "Internal port: $clusteraddr $clusterport");
+for (@main::listen) {
+       $conn = ExtMsg->new_server($_->[0], $_->[1], \&login);
+       $conn->conns("Server $_->[0]/$_->[1]");
+       push @listeners, $conn;
+       dbg('err', "External Port: $_->[0] $_->[1]");
+}
+
+# load bad words
+dbg('err', "load badwords: " . (BadWords::load or "Ok"));
 
 # prime some signals
-$SIG{'INT'} = \&cease;
-$SIG{'TERM'} = \&cease;
-$SIG{'HUP'} = 'IGNORE';
-$SIG{'CHLD'} = \&reap;
+unless ($^O =~ /^MS/) {
+       unless ($DB::VERSION) {
+               $SIG{INT} = \&cease;
+               $SIG{TERM} = \&cease;
+       }
+       $SIG{HUP} = 'IGNORE';
+       $SIG{CHLD} = sub { $zombies++ };
+       
+       $SIG{PIPE} = sub {      dbg('err', "Broken PIPE signal received"); };
+       $SIG{IO} = sub {        dbg('err', "SIGIO received"); };
+       $SIG{WINCH} = $SIG{STOP} = $SIG{CONT} = 'IGNORE';
+       $SIG{KILL} = 'DEFAULT';     # as if it matters....
+
+       # catch the rest with a hopeful message
+       for (keys %SIG) {
+               if (!$SIG{$_}) {
+                       #               dbg('chan', "Catching SIG $_");
+                       $SIG{$_} = sub { my $sig = shift;       DXDebug::confess("Caught signal $sig");  }; 
+               }
+       }
+}
+
+# start dupe system
+DXDupe::init();
 
 # read in system messages
 DXM->init();
@@ -245,48 +370,79 @@ DXM->init();
 # read in command aliases
 CmdAlias->init();
 
-# initialise the protocol engine
-DXProt->init();
-
 # initialise the Geomagnetic data engine
 Geomag->init();
+WCY->init();
 
 # initial the Spot stuff
 Spot->init();
 
+# initialise the protocol engine
+dbg('err', "reading in duplicate spot and WWV info ...");
+DXProt->init();
+
 # put in a DXCluster node for us here so we can add users and take them away
-DXNode->new(0, $mycall, 0, 1, $DXProt::myprot_version); 
+DXNode->new($DXProt::me, $mycall, 0, 1, $DXProt::myprot_version); 
 
 # read in any existing message headers and clean out old crap
-print "reading existing message headers\n";
+dbg('err', "reading existing message headers ...");
 DXMsg->init();
 DXMsg::clean_old();
 
 # read in any cron jobs
-print "reading cron jobs\n";
+dbg('err', "reading cron jobs ...");
 DXCron->init();
 
+# read in database descriptors
+dbg('err', "reading database descriptors ...");
+DXDb::load();
+
+# starting local stuff
+dbg('err', "doing local initialisation ...");
+eval {
+       Local::init();
+};
+dbg('local', "Local::init error $@") if $@;
+
+# print various flags
+#dbg('err', "seful info - \$^D: $^D \$^W: $^W \$^S: $^S \$^P: $^P");
+
 # this, such as it is, is the main loop!
-print "orft we jolly well go ...\n";
+dbg('err', "orft we jolly well go ...");
+
+#open(DB::OUT, "|tee /tmp/aa");
+
 for (;;) {
-       my $timenow;
-       Msg->event_loop(1, 0.001);
-       $timenow = time;
+#      $DB::trace = 1;
+       
+       Msg->event_loop(10, 0.001);
+       my $timenow = time;
        process_inqueue();                      # read in lines from the input queue and despatch them
+#      $DB::trace = 0;
        
        # do timed stuff, ongoing processing happens one a second
        if ($timenow != $systime) {
+               reap if $zombies;
                $systime = $timenow;
-               $cldate = &cldate();
-               $ztime = &ztime();
                DXCron::process();      # do cron jobs
                DXCommandmode::process(); # process ongoing command mode stuff
                DXProt::process();              # process ongoing ak1a pcxx stuff
                DXConnect::process();
+               DXMsg::process();
+               DXDb::process();
+               DXUser::process();
+               DXDupe::process();
+               
+               eval { 
+                       Local::process();       # do any localised processing
+               };
+               dbg('local', "Local::process error $@") if $@;
        }
        if ($decease) {
                last if --$decease <= 0;
        }
 }
+cease(0);
+exit(0);